Masaki  EGUCHI
  • Home
  • About me
  • Projects
  • NLP tools
  • Resources
  • Blog

Multi-word Units Profilerの使い方

8/18/2020

0 Comments

 
言語を学ぶ上では、個別の単語を覚えるだけではなく、その言語で頻繁に使用される定形表現やチャンクを学習し使えるようになることが熟達度の向上に有効であると研究で示されています (Boers et al., 2006; Kremmel et al., 2017; Saito, 2020; Tavakoli & Uchihara, 2019)。
 
定形表現には、例えば “due to”や“no longer” など個別の単語から意味の推測が難しいものが多く含まれます。そのため、知っていないとリーディングで読み違えてしまったり、知っていればスピーキングやライティングで表現したい内容を効率よく伝えられるのに(知らないので表現できない)といったことが起こり得ます。
 
また、定形表現には、例えば“is likely to”や “as well as”などのように、全体の意味が個別の単語と文法知識から予測できるものも含まれます。一見かたまり(チャンク)として覚える必要なさそうなこれらに関しても、あたかも1つの単語のように覚えることで、全体の言語処理の負担を軽減することができ、結果として流暢性の向上に貢献すると考えられています。
 
Multi-Word Units Profilerは英語で頻出するチャンクを特定し、ハイライトして、その表現の頻度等を参照することが出来る無料のウェブアプリです。この記事では、Multi-Word Units Profilerの使い方を簡単に紹介します。
 
 
Multi-Word Units Profilerの目的 

Multi-Word Units Profilerの意義目的は要約すると以下の4点です。
  • Multi-Word Units(あるいはチャンク・表現のかたまり)は、言語処理の認知的な負担を減らし流暢性を高めるなど、英語のスキル向上に貢献すると言われています(Carrol & Conklin, 2019)。
  • しかし、頻出する便利なチャンクかどうかを見極めること自体が難易度の高いことであるため、学習者にこれを求めることは難しいかもしれません。
  • そのため、教師が先導して英文に出てくるチャンクを見つける活動(Awareness raising activities; chunk identification activities; Boers & Lindstromberg, 2009)が推奨されていますが、授業時間の制約もあり、生徒それぞれに合わせたレベルで指導をすることは難しいことです。
  • 「チャンク」を特定してくれるツールがあれば、その使用方法を指導することで学習者が自律的にチャンクを見つけ、表現活動のために覚えたりすることができるかもしれません。Multi-Word Units Profilerはこれを可能にするウェブアプリとして開発を進めています。
 
 
Multi-Word Units Profilerでできること
当アプリでできることは大きく分けて以下の2つです。
  1. 入力した英文の中に含まれるチャンクを特定して色分けする
  2. 特定されたチャンクの出現頻度や機能などを調べる
以下この2つの機能について使用手順を追って説明していきます。
 
 
Multi-Word Units Profilerの使用手順 
  • STEP0: https://multiwordunitsprofiler.pythonanywhere.com にアクセスします。アプリではほとんどの操作をトップページのみでできるように設計されています。
Picture
  • STEP1: トップページのテキストボックスに分析したい英文を貼り付けます。(例では、以下のページに掲載されているイチロー選手に関するこちらの記事を分析します。)
Picture
  • STEP2: 分析するためのMulti-Word Unitsリストを選びます。Version 1.6.0現在は以下の3つのリストでの分析に対応しており、今後リストの拡充を行う予定です(それぞれの説明は今後アップロードします)。また、リストは複数選択が可能です。
    • A Phrasal Expressions List (Martinez & Schmitt, 2012)
    • An Academic Formulas List (Simpson-vlach & Ellis, 2010)
    • Lexical Bundles in University language (Biber et al., 2004)
  • STEP3: “Analyze” (分析)ボタンを押します。(分析に多少時間がかかる場合があります。)処理が終わると分析結果表示されます。
分析結果の見方
 
分析が終わると、2種類のアウトプットが表示されます(Version 1.6.0; 2020/8/16現在)。それぞれ順番に説明します。

1. Annotated text
  • Annotated textでは、分析した英文に含まれるMulti-Word Unitsが頻度別に色付き文字で表示されます。分析はSTEP2で選んだリストを基にされます。
  • 特定されたMulti-Word Unitsは以下のように色付けされます。
Picture
Picture
2. Table output
  • Table outputでは、分析結果として特定されたMulti-Word Unitsの頻度情報やExample sentences等が参照出来ます。例えば、A Phrasal Expressions List (Martinez & Schmitt, 2012) の表を参照すると以下の5つの情報を確認できます。 
    1. 頻度レベル: 1000語(1-K)から5000語(5-K)レベルまで 
    2. 実際の出現頻度(100万語に何回出現するか)
    3. ジャンル毎の出現傾向
    4. A Phrasal Expression Listで提供されている例文情報
  • また、全リスト共通する情報として、左から2つ目の列にそのMWUが分析したテキスト内で何回出現するかを示します。
Picture
  • また、Version 1.6.0現在では、選択したリストによって、参照できる情報が異なり、全く同じ表現でも異なる頻度情報を示す場合があります。これは、Multi-Word Units Profilerが参照したもとの論文に掲載されている頻度情報をそのまま使用しているためです。
  • 今後のアップデートで表示項目や頻度情報の統一を図る予定ですが、アップデートの時期は未定です。

次回の投稿ではVersion1.6.0で利用できるリストについて解説します。

参考文献
  • Biber, D., Conrad, S., & Cortes, V. (2004). If you look at ...: Lexical bundles in university teaching and textbooks. Applied Linguistics, 25(3), 371–405. https://doi.org/10.1093/applin/25.3.371
  • Boers, F., Eyckmans, J., Kappel, J., Stengers, H., & Demecheleer, M. (2006). Formulaic sequences and perceived oral proficiency: Putting a Lexical Approach to the test. Language Teaching Research, 10(3), 245–261. https://doi.org/10.1191/1362168806lr195oa
  • Boers, F., & Lindstromberg, S. (2009). Optimizing a Lexical Approach to Instructed Second Language Acquisition. Palgrave Macmillan UK. https://doi.org/10.1057/9780230245006
  • Carrol, G., & Conklin, K. (2019). Is All Formulaic Language Created Equal? Unpacking the Processing Advantage for Different Types of Formulaic Sequences. Language and Speech, 002383091882323. https://doi.org/10.1177/0023830918823230
  • Kremmel, B., Brunfaut, T., & Alderson, J. C. (2017). Exploring the Role of Phraseological Knowledge in Foreign Language Reading. Applied Linguistics, amv070. https://doi.org/10.1093/applin/amv070
  • Martinez, R., & Schmitt, N. (2012). A Phrasal Expressions List. Applied Linguistics, 33(3), 299–320. https://doi.org/10.1093/applin/ams010
  • Saito, K. (2020). Multi‐ or Single‐Word Units? The Role of Collocation Use in Comprehensible and Contextually Appropriate Second Language Speech. Language Learning, 70(2), 548–588. https://doi.org/10.1111/lang.12387
  • Simpson-vlach, R., & Ellis, N. C. (2010). An academic formulas list: New methods in phraseology research. Applied Linguistics, January, 487–512. https://doi.org/10.1093/applin/amp058
  • Tavakoli, P., & Uchihara, T. (2019). To What Extent Are Multiword Sequences Associated With Oral Fluency? Language Learning, lang.12384. https://doi.org/10.1111/lang.12384
0 Comments

    Author

    I am a Ph.D. student in Applied Linguistics and Second Language Acquisition. I occasionally post on language learning, quantitative research method, and others.

    Archives

    August 2020

    Categories

    All

    RSS Feed

Powered by Create your own unique website with customizable templates.
  • Home
  • About me
  • Projects
  • NLP tools
  • Resources
  • Blog