コンテンツにスキップ

2.2 コーパスを用いた定型表現の確認

このページで学ぶこと

  • 論文コーパスの概要と活用方法
  • ムーブ(move)分析の基本
  • IntroductionのCARSモデル(3つのムーブ)
  • Abstractのムーブ構造(5つのムーブ)
  • Methods・Results・Discussionの定型表現パターン
  • Hedging(断定を避ける表現)の役割
  • Reporting verbs の体系的な使い分け
  • 研究分野に応じた定型表現の調査方法
  • セクション別の頻出フレーズ集

論文コーパスとは

論文コーパス(corpus)とは、学術論文を大量に集めたテキストのデータベースです。自分の分野でどのような表現が実際に使われているかを調べることで、「自然な学術英語」の感覚をデータに基づいて身につけることができます。

無料利用が可能な学術英語コーパスの例

ツール 特徴 URL
CorpusMate 学術英語に特化したコーパス https://corpusmate.com/
COCA (Corpus of Contemporary American English) 10億語超の米英語汎用コーパス。Academicセクションあり https://www.english-corpora.org/coca/
MICUSP(Michigan Corpus of Upper level Student Papers) 学部や大学院でA 評価の学生論文 https://elicorpora.info/
Michigan Corpus of Academic Spoken English 学術的な話し言葉コーパス https://quod.lib.umich.edu/m/micase/
Elsevier OA CC-BY Corpus Elsevier社のオープンアクセス英語論文コーパス。ダウンロードが必要 https://elsevier.digitalcommonsdata.com/datasets/zm33cdndxs/3
Europe PMC 生命科学系中心。無料で検索でき、条件によってはフルテキスト(Free full text)にも到達できる。 https://europepmc.org/
PubMed Central (PMC) 生物医学系中心。無料で論文全文を読めるものが多い(OAを含む)。 https://pmc.ncbi.nlm.nih.gov/
arXiv 主要分野のプレプリントを無料で検索できる。 https://arxiv.org/search/
Semantic Scholar 無料の論文検索。論文ページからフルテキスト入手先への導線が用意されている。 https://www.semanticscholar.org/
CORE 世界中のオープンアクセス論文を集約し、検索エンジンとして提供。 https://core.ac.uk/
OpenAlex (Works) 研究成果(Works)を大規模に検索できるオープンカタログ。 https://openalex.org/works
The Lens (Scholarly Works) Scholarly records を検索・分析できる(無料で利用可能な範囲あり)。 https://www.lens.org/
BASE (Bielefeld Academic Search Engine) 学術ウェブリソースを横断検索できる学術検索エンジン(OAが多い)。 https://www.base-search.net/
bioRxiv 生物系プレプリント。サイト内で検索が可能。 https://www.biorxiv.org/search
medRxiv 医学系プレプリント。サイト内で検索が可能。 https://www.medrxiv.org/search
ACL Anthology 計算言語学・NLP分野の論文アーカイブ。ブラウザで検索・閲覧できる。 https://aclanthology.org/

Google Scholar を簡易コーパスとして使う

専用のコーパスやツールを使わなくても、Google Scholar で表現の頻度をざっくり確認できます。

使い方: 調べたい表現をダブルクォーテーション("")で囲んで検索する

ヒット数の多い表現ほど、学術論文で広く使われていると判断できます。ただし分野による偏りがあるため、あくまで目安として使ってください。

ムーブ分析の基本

ムーブ(move)とは、学術論文の各セクションで果たされる「修辞的機能」のことです。

修辞的機能とは、ある文や段落が論文の中で果たしているコミュニケーション上の役割のことです。例えば、「先行研究の不足点を指摘する」「研究の目的を述べる」「結果の意義を主張する」といった役割がそれぞれ一つのムーブに該当します。つまり、ムーブ分析では「何が書かれているか」という内容そのものではなく、「その箇所が読者に対してどのような働きをしているか」に注目します。

そして、各ムーブにはそれを実現するための定型表現が存在し、例えば研究目的を述べるムーブでは "The aim of this study is to..." のような表現が典型的に用いられます。

ムーブと定型表現を使いこなす意味

学術論文は「ジャンル」の一つであり、それぞれのジャンルには特定のディスコース・コミュニティ(専門家集団)が共有するコミュニケーションの慣習があります。ムーブ構造や定型表現を適切に使いこなすことは、単なる「英語力」の問題ではなく、その専門家集団に属していることを示す手段でもあります。また、同じ研究論文というジャンルでも、専門用語だけでなく頻出フレーズやムーブの慣例は分野ごとに異なります(Hyland, 2008)。自分の分野の慣習を把握することが重要です。

なお、こうした定型表現を使うことは剽窃にはあたりません。"studies have shown" などのフレーズが著作権で保護され特定の著者に帰属すると主張することは合理的ではなく(Ferris, 2011)、むしろ読者が期待するフレーズを使うことで効率的に読ませることが可能になると言われています(Conrad, 2008)。

Swales (1990) のCARSモデル(Create a Research Space)がムーブ分析のモデルとしてよく使用されます。 CARSモデル

ムーブの中の"Step"について

分野によってどのStepを含むか含まないかは異なります。

IntroductionのCARSモデル(3つのムーブ)

Move 1: 研究領域の確立(Establishing a territory)

  • 研究分野の重要性を主張する
  • 先行研究を概観する

よく使われる表現例:

  • "X has been widely studied..."
  • "Recent research has shown that..."
  • "There is growing interest in..."

Move 2: ニッチの確立(Establishing a niche)

  • 先行研究の課題やギャップを指摘する

よく使われる表現例:

  • "However, few studies have examined..."
  • "Little is known about..."
  • "Previous research has not adequately addressed..."

Move 3: ニッチの占拠(Occupying the niche)

  • 本研究の目的を述べる

よく使われる表現例:

  • "The present study aims to..."
  • "This paper investigates..."
  • "The purpose of this study is to..."

Abstractのムーブ

Abstractにも定型的なムーブ構造があり、基本的には以下の5つのムーブから構成されています。

ムーブ 機能 典型的な表現
Background(背景) 研究の背景や文脈を提示 X has become increasingly important... / Recent advances in...
Purpose(目的) 研究の目的や問いを明示 The present study aims to... / This paper investigates...
Method(方法) 研究方法を簡潔に記述 We utilized... / Data were collected from... / N participants completed...
Results(結果) 主要な結果を報告 The results showed that... / The analysis revealed...
Conclusion(結論) 結論や含意を述べる These findings suggest that... / The paper concludes by...

これらの5つのムーブが順番通りに並ぶのが一般的ですが、分野やジャーナルによってはいくつかのムーブが省略されたり、順序が変わったりすることもあります。

以下は、応用言語学分野の実際の論文(Mizumoto & Eguchi, 2023)のアブストラクトを使ってムーブ構造を分析した例です。

Abstractのムーブ構造

Abstractのセルフチェック

自分のAbstractを書いた後、上記の5つのムーブがすべて含まれているかを確認しましょう。特にBackground(背景)とConclusion(結論)は省略されやすいムーブです。ご自身の専門分野における慣習を必ず確認しましょう。

AIプロンプト例:Abstractのムーブ分析

以下のAbstractを分析し、5つのムーブ(Background, Purpose, Method, Results, Conclusion)が
それぞれどの文に対応するか特定してください。
欠けているムーブがあれば指摘し、追加すべき内容を提案してください。

[ここにAbstractを貼り付ける]

Methods・Results・Discussionのムーブパターン

CARSモデルはIntroductionに焦点を当てていますが、他のセクションにも典型的なムーブパターンがあります。

Methods のムーブ

ムーブ 機能 典型的な表現
参加者の記述 誰を対象にしたか A total of N participants were recruited...
材料・道具の記述 何を使ったか The instrument consisted of... / A questionnaire was developed...
手順の記述 どのように実施したか Data were collected over a period of... / Each session lasted approximately...
データ分析の記述 どう分析したか The data were analyzed using... / A two-way ANOVA was conducted...

Results のムーブ

ムーブ 機能 典型的な表現
準備的情報 分析の前提条件 Before conducting the main analysis, ... / Preliminary checks indicated...
結果の報告 主要な結果を述べる The analysis revealed that... / A significant difference was found...
図表への言及 データの視覚的提示 As shown in Table 1, ... / Figure 2 illustrates...
結果のコメント 結果への簡潔な補足 This pattern was consistent across... / Notably, ...

ResultsセクションとDiscussionセクションの違い

  • Resultsでは結果を客観的に報告し、深い解釈はDiscussionで行います。ただし、結果への簡潔なコメント("This result was unexpected..." など)は許容されます。Resultsで "This suggests that..." を多用するとDiscussionとの境界が曖昧になるため注意が必要です。
  • Discussionセクションでは、結果のまとめ、解釈、先行研究との比較・理論的含意など、「なぜそうなったのか」「何を意味するのか」を論じます。
  • 論文によっては、Results and Discussion とひとまとめにしている場合もあります。

Discussion のムーブ

ムーブ 機能 典型的な表現
結果の要約 主要な知見を簡潔に再掲 The findings of the present study indicate that...
結果の解釈 結果が何を意味するか A possible explanation for this result is that...
先行研究との比較 既存研究との関係 This finding is consistent with... / In contrast to Smith (2020), ...
含意の提示 理論的・実践的意義 These results have implications for...
限界の記述 本研究の制約 A limitation of this study is that... / The sample was limited to...
今後の研究 将来の方向性 Future research should examine... / Further investigation is warranted...

AIプロンプト例:Discussionのムーブ構成チェック

以下のDiscussionセクションを分析し、次の6つのムーブがそれぞれ
含まれているか確認してください。
(1) 結果の要約  (2) 結果の解釈  (3) 先行研究との比較
(4) 含意の提示  (5) 限界の記述  (6) 今後の研究

欠けているムーブ、または順序が不自然な箇所があれば指摘してください。
内容の追加は不要です。

[ここにDiscussionを貼り付ける]

Hedging(断定を避ける表現)

学術論文では、主張の確実性を調整する hedging 表現が重要な役割を果たします。特にソフトサイエンスと呼ばれる人文社会科学系の英語論文の Discussion では、結果の解釈に慎重さが求められるため頻出します。また、結果の評価を読者に委ね共感してもらうための修辞的手段としても機能しています。

典型的なHedging表現

Academic Phrasebank を活用する

各ムーブで使える定型表現をさらに知りたい場合は、マンチェスター大学が提供する Academic Phrasebank が便利です。Introduction, Methods, Results, Discussion など論文の各セクション別に、実際の学術論文で頻用される表現が体系的にまとめられています。

Reporting Verbs(報告動詞)の使い分け

先行研究を引用する際、どの動詞を選ぶかで「著者のスタンス」が変わります。

スタンス別の分類

スタンス 動詞の例 ニュアンス
中立的な報告 reported, found, observed, noted, described 事実を客観的に伝える
積極的な主張 argued, claimed, maintained, asserted, contended 著者が強い立場を取った
示唆・提案 suggested, indicated, implied, proposed, recommended 断定を避けたニュアンス
実証・証明 demonstrated, confirmed, established, showed, proved データによる裏付けがある
批判・疑問 questioned, challenged, criticized, disputed, rejected 先行研究への異議

日本人英語ユーザーが陥りやすい Reporting Verbs の問題

  • "said" の多用: 学術英語では said はほぼ使いません。reported, noted, argued などを使い分けましょう。
  • 動詞の強さの誤認: proveddemonstrated は非常に強い表現です。先行研究がそこまで確定的でない場合は suggestedindicated を選びましょう。
  • すべて同じ動詞: found だけを繰り返すと単調になります。スタンスに応じて使い分けてください。

AIプロンプト例:Reporting Verbs の点検

以下のIntroduction(またはLiterature Review)で使われている
reporting verbs(先行研究を引用する際の動詞)をすべて抽出し、
一覧表にしてください。

(1) 同じ動詞が3回以上使われていないか
(2) 中立的な報告に強い動詞(proved, demonstrated等)を
    使っていないか
(3) 文脈に照らして不適切な動詞がないか

問題があれば指摘し、代替表現を1つずつ提案してください。

[ここに本文を貼り付ける]

ハンズオン:自分の分野の表現を調べる

方法1: 自作コーパスを使う

  • 自分の分野の関連論文を3-10本程度(多ければ多いほど良い)を PDF で用意する。
  • AntConcをダウンロードする。(※ Macの方はCasualConc もオススメです。)
  • AntConc をインストールしたら以下の手順で PDF を読み込む。
    • “File” > “Open Corpus Manager” > Corpus Source でRaw File(s)
      > pdf ファイルを選択 > [Create]ボタンを押下 > [Return to Main Window] ボタンを押下
    • 1本だけの場合:“File” > “Open File(s) as ‘Quick Corpus’”
  • このページにある定型表現を入力して、どのように使われているかを確認する。

    AntConcのKWIC表示例

  • AntConc の使用方法はチュートリアル を参考。

  • PLOS ONE に掲載されている論文であれば、AntCorGen を使って自動的にコーパスを作成することが可能。
  • 最新版 AntConc では各種 LLM が ChatAI から使えるため、検索したフレーズについての質問も可能。(※要API)

    AntConcのChatAI

方法2: 生成AIを併用する

生成AIにムーブごとの表現パターンを提案させ、それをコーパス(AntConc)で検証する方法も効率的です。

AIプロンプト例:よく使われる英語表現の検証

応用言語学の実証研究論文のIntroductionで、Move 2(先行研究のギャップ指摘)に
よく使われる英語表現を10個挙げてください。

注意: 架空の論文からの引用は不要です。一般的な表現パターンのみ。 

特定の語がどのような語と共起しやすいか(コロケーション)を確認してみてもよいでしょう。

AIプロンプト例:コロケーションの確認

学術英語で "significant" と共起しやすい名詞を10個挙げてください。
(例: significant difference, significant effect...)
それぞれの使用頻度の目安(高・中・低)と、
主にどのセクションで使われるかも示してください。

確認のポイント

  • 生成AIが提案したコロケーションは、コーパスはもちろんのこと、Google Scholar でダブルクォーテーション検索(例: "significant improvement")して実際のヒット数を確認すると信頼性が高まります。
  • 生成AIが提案した表現が実際に学術論文で使われているかどうか自信がなければ、自作コーパスや Google Scholarで検索して確認するようにしましょう。
  • 特定の分野の内容・英語表現については、精度の観点から、自作コーパスのほうが生成AI(大規模言語モデル)よりも優れています。
  • 自分の分野の研究者に「仲間だ」と思ってもらえる英語にするには、自分の所属する(しようとする)ディスコース・コミュニティーの特定のジャンル(論文)で使用されている表現を、論文コーパスで確認して使用しましょう。

セクション別の頻出フレーズ集

以下は各セクションで高頻度に使われるフレーズの一部です。自分の分野でもこれらが使われているか、コーパスやGoogle Scholarで確認してみてください。

Introduction

機能 フレーズ例
分野の重要性 X plays a crucial role in... / X has attracted considerable attention...
先行研究の要約 A number of studies have investigated... / Previous research has focused on...
ギャップの指摘 To date, no study has... / There remains a need for...
目的の提示 This study seeks to... / The aim of this paper is to...

Methods

機能 フレーズ例
参加者 A total of N participants (M age = ...) took part in...
手順 The experiment was conducted in... / Data collection took place over...
分析 Descriptive statistics were computed for... / To examine..., a t-test was performed.

Results

機能 フレーズ例
結果の導入 Table 1 presents the descriptive statistics for...
有意差の報告 A statistically significant difference was observed, t(df) = ..., p < ...
効果量の報告 The effect size was medium (Cohen's d = ...)

Discussion

機能 フレーズ例
結果の再掲 The most notable finding was that...
解釈 One possible explanation is that... / This may be attributed to...
先行研究との一致 This finding aligns with... / This is in line with the results of...
先行研究との不一致 This result contradicts... / Unlike Smith (2020), the present study found...
限界 This study has several limitations. First, ...

AIプロンプト例:フレーズの自然さチェック

以下の英文に含まれる学術的フレーズについて、
(1) 不自然または非標準的な表現がないか
(2) より一般的な代替表現があるか
を確認してください。各指摘に対して代替案を1つ提示してください。

[ここに英文を貼り付ける]