日本の子供たちが、英語を身につけて ミライに羽ばたくために。
2023.04.06
東京都は、2022年11月、都内の公立中学校3年生を対象に、中学英語スピーキングテスト (ESAT-J)を実施。2023年度から都立高校入試に活用されることが発表され、さまざまな観点から議論が交わされています。
そこで今回は、スピーキングの一つの側面であり、ESAT-Jの採点基準にも含まれている「流暢さ」について研究されている鈴木研究員(早稲田大学GCS研究機構)にお話を伺いました。鈴木研究員は、AI技術を駆使したスピーキングテストの研究開発にも取り組んでいることから、流暢さの仕組みや評価について考えます。
この前編は、流暢さとは何か、流暢さをどのように評価するか、がテーマです。
著者:佐藤 有里
●スピーキングの「流暢さ(fluency)」とは、適切なスピードで、あまり止まったり言い直したりしないでスムーズに話せることであり、聞き手がストレスなく聞いたり理解したりするうえで重要。
●流暢さを高めるためには、語彙や文法、発音の知識を増やすだけではなく、それらの知識を引き出すスピードを上げるためのトレーニングが必要。
●スピーキングテストにおける流暢さの評価は、関連する指標は研究で明らかになっているものの、指導や学習に役立つ情報を得ることは難しい、という点が課題。
●AIスピーキングテストで集まる大規模な発話データの分析により、「指導と評価の一体化」を目指す言語テスト研究の進展が期待される。
【目次】
―鈴木先生は、もともと英語教員を目指されていたそうです。どのようなきっかけで、スピーキング(発話)の研究に興味を持たれたのでしょうか?
私が学部生のときに履修していたゼミ(演習)では、授業がすべて英語で行われていたのですが、「英語英文学科で2年間英語を学んできたのに、こんなにも英語を話せないものか」と思いました。
さらに、英語教員を目指すうえで専門性を持ちたくて大学院進学を決めたものの、そのために受験しなければならないTOEFL iBTテストで特にスピーキングができなくて焦りました。
自分のスピーキングをひたすら録音して、「ここの発音が下手だな」とか「ここの文法は間違っている」というふうに、できていないところがわかっても、どこから手をつけていいかわかりませんでした。
このような体験をする中で、人はどうすれば効率よく英語をペラペラと話せるようになるのか、そもそもペラペラとはどういう状態なのか、ということがわからないまま英語を教えていいのだろうか、と疑問に感じたことが研究の出発点です。
―いざスピーキング力が必要になったときに、「何をどうすれば上達するかわからない」という人は多いかもしれません。ゴールを明確にしておくことも大切ですよね。
私も、「英語がうまくなりたい」という気持ちはずっとありましたが、具体的にどのように話せれば良いか、ということが曖昧でした。
TOEFLのスコアを上げようとしていたときは、難しい単語を、それこそ必要以上に使って話そうとしていた時期もありました。
でも、それが本当にスピーキング力のゴールなのかどうか疑問に思ったんです。
例えば、難しい内容について話すときには、難しいことばを使わずに、具体例を交えたりしながらわかりやすく伝えることが求められる場合もありますよね。
そのときどきで求められるスピーキング力が異なることを考えると、いろいろな場面で汎用的に使えるようなスピーキング力の根本的な部分をまずは伸ばすべきなのではないかと考えました。
スピーキングのメカニズムを明らかにして、その構成要素を一つひとつ鍛えることができれば十分なのではないか、ということですね。
斉藤一弥先生(ロンドン大学 准教授)の授業やJudit Kormos先生(ランカスター大学教授)の著書でスピーキングのメカニズムについて学ぶ機会があったときに、この分野を極めたいと思い、ランカスター大学(イギリス)の修士課程・博士課程に進学しました。
―先生は、主に「流暢性」について研究していらっしゃいます。一般的に「流暢に話せるようになりたい」、「〜さんの英語は流暢だ」とよく言われますが、流暢性とはどのようなことでしょうか?
流暢性(fluency)に関する研究の第一人者の一人、Pavaneh Tavakoli先生(レディング大学 教授)の研究(Tavakoli & Hunter, 2018)では、流暢さの定義が人によって異なることがわかっています。
イギリスで外国語を教えている教員84名を対象に、流暢性をどのように定義しているか、流暢性を鍛えるためにどのような指導をしているか、どのように流暢性を評価しているか、ということを調べるアンケート調査が行われました。
結果、43%は、スピーキング能力全般(broad)、として流暢性を定義していました(broadの定義)。
一方、スピードなど、スピーキングの時間的な特徴に絞って流暢性を定義(narrowまたはvery narrowの定義)していた教員は、13%だけでした。
第二言語習得における流暢性に関する研究は、特に「very narrow」の定義で進んできているので、いかに実践者と研究との間にギャップがあったかということがわかりました。
・very narrow(とても狭い意味) 話すスピードが適切で、止まったり言い直したりすることが少ないこと。
・narrow(狭い意味) 発話のテンポが良い、聞き取りやすいなど。文法的な複雑さや正確さは含まれない。
・broad(広い意味) 一般的なスピーキング能力。自信をもって話せる、意図した内容を口頭で伝えられる、会話ができる、など。
・very broad(とても広い意味) スピーキングに限らず、その言語の習熟度が高いこと。
―スピーキングテストでは、どのように定義されているのでしょうか?
言語テストでは、narrowとbroadの間の定義がよく使われています。
例えば、IELTS(アイエルツ)(※1)では、ルーブリック上で発話の一貫性(coherence)を含めて評価しています。おそらく、話すスピードがどんなに速くても、話題や展開が崩れてしまうのであればスピーキング能力を測るという目的にそぐわないからだと思います。
一方、TOEFL(トーフル)(※2)では発音やイントネーション、通じやすさ(intelligibility)、PTEアカデミック(※3)ではリズムや音韻の正確さ(発音するべき音が抜け落ちないこと)、というように、発音の側面を含めています。
―研究者、教員、テスト、それぞれでどういうふうに「流暢さ」を認識しているかが違うのですね。すると、流暢に話せるようになるために何を教えるべきか、何を学ぶべきか、ということにも違いが出てきそうです。
そうですね。目指しているところが違っていると、研究でわかったこと、指導の実践でわかったこと、言語テストでわかったことがお互いに伝わりにくいですし、それぞれを活かすことができません。
ですから、研究者や実践者がお互いにもっとコミュニケーションを取っていかないといけないですよね。とてもインパクトのある、重要な研究だったと思います。
―流暢性は、国際的なスピーキングテストの評価基準として含まれていることが多いですよね。それはなぜだと思われますか?
流暢性に関する研究は、もともとESL環境(第二言語として英語を学ぶ環境)(※4)で生まれました。ですから、スピーキングテストで流暢性を評価しようとする理由として、ESL環境にいる学習者が日常生活でサバイブするために必要なスキルを重視しているから、ということが考えられます。
流暢性の低さは、聞き手からの信頼を失ったり聞き手にストレスを与えたりすることにつながります(Lennon, 2000)。
ネイティブ・スピーカー同士でしか話したことがない人たちは、流暢性が低い、つまり、途中で止まってしまうことが多い人の発話を聞いたときに、「単語が出てこないんだな」ということがわからず、「考えていない」・「態度が悪い」と解釈してしまい、その人に対する信頼を失ってしまうことがあるんです。
ですから、多少の間違いがあってもいいので、リズムよく話せるようにすることが急務です。
話せば話すほど、伝える情報は増えます。情報を伝えることがコミュニケーションなのであれば、流暢性をある程度習得する必要があるのではないか、ということが2,000年代くらいに言われていました。
―自分が伝えたい情報をしっかり聞いて理解してもらうためには、ある程度のスピードでスムーズに話す必要がある、ということですね。流暢さがどのように聞き手の理解に影響するかを調べた研究もあるのでしょうか?
流暢性が日本人英語学習者の発話のわかりやすさに関係するかどうかを調べたことがあります。結果、聞き手(ネイティブ・スピーカー)がストレスを感じずに理解できる発話には、ポーズ(発話の途中で止まること)の頻度や長さ、スピードなど、流暢性が大きく影響していました(Suzuki & Kormos, 2020)。
聞き手が聴解処理しやすいようにするためには、聞き手の処理速度に合ったスピードで話さないといけません。
相手がネイティブ・スピーカーであれば、もちろん処理するスピードが速いので、話すスピードも速くしてあげたほうがわかりやすいんです。これは、聞き手にストレスを与えないことにもつながります。
例えば、YouTubeの動画を倍速で再生して見る人もいますよね。それは、日本語(母語)の処理速度が速いので、話すスピードが倍速であっても理解できるからです。
流暢な発話でないと信頼を失う、わかりにくくなる、という点は、聞き手の問題ではあるのですが、ESL環境(第二言語として英語を学ぶ環境)ではどうしても流暢性が重要になってきます。
―聞き手の処理速度に合ったスピードで話すと、理解してもらいやすくなるのですね。
そうですね。ですから、ネイティブ・スピーカーのようなスピードで話せればいい、というわけではありません。
学習者を相手に話すときには、その人の処理速度に合わせてゆっくり話すほうが適切です。また、内容が難しい時も、早く話すとかえって理解できない場合がありますよね。
聞き手や場面に合わせてスピードを調整して話せることが大切ですね。
―では、第二言語習得の分野で研究されている、狭い意味での「流暢さ」についてくわしく伺わせてください。流暢かどうかは、発話のどのような特徴で評価するのでしょうか?
第二言語習得の分野では、3つの指標で評価することが提案されています(Tavakoli & Skehan, 2005)。
・速度(speed)……発話時間あたりの発語数もしくは音節数
・ポーズ(breakdown)……沈黙の長さや頻度
・修正(repair)……繰り返し・言い直しなど言い淀みの頻度
この2005年の研究では、絵を描写するスピーキング・タスクを使って、流暢性は主にこの三つの側面からなることがわかったのですが、ほかのさまざまなタスク(例:意見を述べる)で調べた私の研究(Suzuki & Kormos, 2022)でも同じ結果が出ました。
―実際に相手が話しているところを聞いて「流暢だ」と感じるかどうかも、この3つの側面から影響を受けるのでしょうか?
相手のどのような側面で「この人は英語がうまいね」、「この人は英語が下手だね」と判断しているのか、という点については、いろいろな方法で研究が行われているものの、どの側面が一番評価に影響するかは、研究によって異なる結果が出ています。
そこで、メタ分析という方法で研究(Suzuki et al., 2021)を行いました。既存の22個の研究結果をまとめて分析して、どの側面が流暢さの判断をどれくらい予測できるかを調べたものです。
その結果、タスクによって異なりますが、速度、ポーズ、修正という指標で流暢性の評価を少なくとも50%、多くて94%説明できることがわかりました。ですから、流暢性を評価する指標はこれらで十分だろうと考えられます。
―スピード、ブレイクダウン、リペアのうち、どれが一番判断に影響するのでしょうか?
従来は、1分間にどれくらいの単語が出てくるか(speech rate)などの指標が流暢性の評価に使われることが多く、速度、ポーズ、修正など、いろいろな側面が含まれるため、composite measures(複合的な指標)と呼ばれています。
これが一番強く聞き手による流暢性の評価(perceived fluency)を予測できたのですが、「文の途中で止まる」(ブレイクダウンの一つであるmid-clause pause)という単体の指標がそれに次ぐ強さでした。
私たちは、間を置いたり息継ぎをしたりするために、文と文の間(文の終わり)で止まることがありますよね。
でも、文の途中で止まることが多かったり、その止まる時間が長かったりすると、「この人の英語は流暢ではない」という判断に大きく影響するのではないか、ということがわかりました。
例えば、意味のまとまりの途中で止まると、聞き手の理解を妨げてしまったり、聞き手が止まる前の情報を短期記憶に残さなければいけなくてストレスを感じたりすることがあります。
そのようなことも踏まえると、どこで止まるかが大事なのではないかと考えています。
―例えば、学習指導要領では、スピーキングが「発表」と「やり取り」に分かれています。やり取りの場合は、スピード、ブレイクダウン、リペアのほかにも、聞き手が流暢だと思うかどうかに影響する発話の特徴があるでしょうか?
実は、既存の研究は、モノローグの発話(対話相手がいない状態で一人で話すこと)に基づく研究がほとんどです。ダイアローグの発話(相手と対話すること)を対象とした研究は少ないため、どのような特徴が流暢性の評価に影響するかはまだわからないですね。
InteLLA(会話AIエージェント)による英語能力判定システム(※5)の研究開発に携わっているのですが、そこで集まったデータ(AIエージェントと学習者の対話データ)を使って分析したところ(Matsusura et al., 2022)、速度、ポーズ、修正といった既存の特徴では流暢性の判定結果を50%説明できました。
一方で、私たちが会話するときは、相手と共通認識を持っていることを示すために、自然と、相手が使った表現を自分も使って話します。
また、話し手がどれくらいで交代するか(発話ターンの長さ)、一人が話し終わってからもう一人が話し始めるまでにどれくらい間があるか(発話ターン間のポーズの長さ)など、対話にしかない発話の特徴が見られます。
これらの特徴を加えて流暢性との関係を見ると、判定結果を70%説明できることがわかりました。
ですから、対話のときの流暢性を評価する指標には、対話にしかない特徴も入れる必要があると思います。
―流暢さは、どのように発達していくと考えられますか?
日本人の英語学習者に絵を描写してもらって発話の特徴を調べる研究(Saito et al., 2018)でわかったことがあります。
日本人英語学習者は、ネイティブ・スピーカー(詳細な評価基準は知らされていない)が発話を聞いたときにどれくらい流暢だと思うか、という聞き手の評価により、初級者、中級者、上級者、という3グループに分かれました。
結果、中級者は、初級者よりも節間のポーズ(文と文の間で止まること)が少なかったです。
留学に行くと、最初は英語を話しているときに疲れてしまいますが、そのうち英語モードで物事を考えるようになると楽になりますよね。
理論的なモデルでは、発話は概念化(伝えるメッセージ内容を考えること)から始まると言われています(Kormos, 2006)。おそらく、そこを英語のモードで、日本語を介さずに素早くできるようになると、次の文を話し始める前に止まることが少なくなっていくのだと思います。
―まずは、文と文の間で止まることが少なくなるのですね。中級者と上級者の違いは、どのようなところでしたか?
上級者は、節内のポーズ(文の途中で止まること)が少なく、話すスピードも速くなる、という違いがありました。
さらにネイティブ・スピーカーは、話すスピードがミリ秒単位でさらに速くなります。このレベルになると、リダクション(発音されるはずの音が弱くなること)やリンキング(音がつながって別の音に聞こえること)が起きたりして、発音も変わってくると思います。
この研究では、節間のポーズ(文と文の間で止まること)、節内のポーズ(文の途中で止まること)、そして最後にスピード、というふうに流暢性が発達していくことが示唆されました。
同じ学習者の発話がどのように変化していくかを追って調査した場合に同じ結果が出るかは現時点でわかりませんが、いま私が研究開発に携わっているInteLLAを定期的に使う学習者が増えてくれば、大規模なデータから明らかになってくるのではないかと期待しています。
―すると、ネイティブ・スピーカーのようなスピードや発音で話そうとするよりも、「止まらずに話す」を先に意識したほうがよいでしょうか?
そうですね。まずは、伝えたい内容をパッと英語に変換できるようになる。そして、例えばIn . . . . . . front . . . . . . ofとならないように、スムーズに口に出せるようになる。すると、話すスピードも上がって自然とリダクションやリンキングが起きます。
ネイティブ・スピーカーのような発音を練習したい、という学習者のニーズがある場合は練習させてあげてもよいと思いますが、この研究結果からは、止まらないように話せるようになってから明示的に教えたほうが効率的だと言えます。
そして、速いスピードで話すべきところは速くする、トピックの難しさや相手によってはあまり速くしない、ということができるようになっていくと、自在に流暢性を扱うことができるのではないかと思います。
―そもそも、ネイティブ・スピーカーのような流暢さを身につけることはできるのでしょうか?
この研究では、日本人の英語学習者90人のうち、ネイティブ・レベルの流暢性(学習者の発話を聞いたネイティブ・スピーカーによる評価)に達していた人が7人いました。
彼らは全員20歳を超えてから海外に滞在し始めた人たちです。6カ月の滞在だけでそのレベルに達している人もいれば、1年半くらいかかっている人もいましたが、大人になってから海外に住んだ人でも、聞き手から「ネイティブ・レベル」と評価される流暢性に達する人がいるということですね。
ただ、のちほどくわしくお話ししますが、そのネイティブ・レベルの流暢性の裏で何が起きているかはわかりません。
ネイティブ・スピーカーと同じ言語知識や処理速度というわけではなくても、いろいろな戦略を使ったり、地道にスピードをトレーニングしたりすることで、表面上のネイティブ・レベルに達している場合もあります。
頭の中でのルートは違っていても、ネイティブ・レベルのパフォーマンスに達することができそうだ、ということです。
ですから、そのレベルを目指したい人は目指してもいいのではないかと思います。
でも、やはり聞き手がいて初めてコミュニケーションが成り立つので、話すスピードが速いほうが理解しやすい、という聞き手のニーズがなさそうであれば、そこまでがんばらなくていいかもしれません。
(※1)IELTS(International English Language Testing System)は、英語圏の国に留学、就労、移住を希望する人々を対象にした英語能力判定試験として国際的に認知されている。IDP:IELTS Australia、Cambridge Assessment English、British Councilの3団体が共同開発(IDP IELTS, 2023)。
(※2)TOEFL(Test of English as a Foreign Language)は、英語を母語としない人々を対象にした英語能力判定試験。世界各国の大学・大学院、その他機関が、入学選考などの場面で英語力証明として利用している。ETSが開発(ETS Japan, 2023)。
(※3)PTEアカデミック(Pearson Test of English Academic)は、世界中の教育機関で認定されている英語能力判定試験。オーストラリアやニュージーランドでは、すべてのビザ取得の際の英語力証明として認められている。ピアソンが開発(Pearson, 2023)。
(※4)ESLは、English as a Second Language(第二言語としての英語)の略。第一言語(母語)のほかに、地域社会や学校、家庭などで日常的に触れる環境で学ぶもう一つの言語(例:英語圏の国に住んでいる日本人にとっての英語)のことを指す。一方で、そのような日常生活で触れることのない環境で学ぶ言語をEFL(English as a Foreign Language/外国語としての英語)(例:日本に住んでいる日本人にとっての英語)と言う。
(※5)InteLLA(Intelligent Language Learning Assistant)は、対話システム技術を使って、学習者のレベルや理解度に合わせて質問を変更したり、発話を引き出したり、言語能力を評価したりする会話AIエージェント。早稲田大学 GCS研究機構 知覚情報システム研究所が研究開発を行い、2022年度から同大学で実証実験を開始。
【取材協力】
鈴木 駿吾 次席研究員(研究院 講師)
早稲田大学 GCS研究機構 知覚情報システム研究所
専門は、外国語教育、第二言語習得。質の高い発話とは何か、第二言語での発話はタスクの難易度や性質に応じてどのように変わるか、第二言語学習者が流暢に話せるようになるためにはどのような言語知識が必要か、といったテーマで研究を行う。英国ランカスター大学にて博士号(言語学)を取得し、2021年より現職。ランカスター大学 言語学部 客員講師、早稲田大学 文学学術院 非常勤講師も務める。早稲田大学 GCS研究機構の語学学習支援プロジェクト「人と共に成長するオンライン語学学習支援AIシステムの開発」の共同代表を務め、能力判定システムの研究開発チームを率いる。同研究チームが開発した会話AIエージェント「InteLLA」は2021年に世界最大の教育コンテスト「the QS-Wharton Reimagine Education Award」で表彰された。2023年度より英会話能力判定システム「LANGX Speaking」として、早稲田大学の正規英語科目「Tutorial English」に正式採用されている。早稲田大学発スタートアップ「株式会社エキュメノポリス」のリサーチ・サイエンティスト。
■InteLLAのデモムービー
■関連記事
社会的会話AIの研究開発から学ぶ「コミュニケーション能力」のあり方〜早稲田大学GCS研究機構 松山 主任研究員&鈴木 次席研究員インタビュー(前編)〜
社会的会話AIの研究開発から学ぶ「コミュニケーション能力」のあり方 〜早稲田大学GCS研究機構 松山 主任研究員&鈴木 次席研究員インタビュー(後編)〜
ETS Japan (2023). TOEFLテスト基本情報. TOEFL®️テスト 日本事務局.
https://www.toefl-ibt.jp/educators/toefl/about/
IDP IELTS (2023), IELTSとは. IDP IELTS.
https://ieltsjp.com/japan/about
Kormos, J. (2006). Speech production and second language acquisition. Lawrence Erlbaum Associates.
Lennon, P. (2000). The lexical element in spoken second language fluency. In H. Riggenbach (Ed.), Perspectives on fluency (pp. 25–42). The University of Michigan Press.
Matsuura, R., Suzuki, S., Saeki, M., Ogawa, T., & Matsuyama, Y. (2022). Refinement of utterance fluency feature extraction and automated scoring of L2 oral fluency with dialogic features. 2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), 1312–1320.
https://doi.org/10.23919/APSIPAASC55919.2022.9980148
Pearson (2023). PTE Academic. Pearson.
https://www.pearson.com/jp/ja/assessment/pte-academic.html
Saito, K., Ilkan, M., Magne, V., Tran, M., & Suzuki, S. (2018). Acoustic characteristics and learner profiles of low-, mid- and high-level second language fluency. Applied Psycholinguistics, 39(3), 593-617.
https://doi.org/10.1017/S0142716417000571
Segalowitz, N. (2010). Cognitive bases of second language fluency. Routledge.
Suzuki, S., & Kormos, J. (2020). Linguistic dimensions of comprehensibility and perceived fluency: An investigation of complexity, accuracy, and fluency in second language argumentative speech. Studies in Second Language Acquisition, 42(1), 143-167.
https://doi.org/10.1017/S0272263119000421
Suzuki, S., & Kormos, J. (2022). The multidimensionality of second language oral fluency: Interfacing cognitive fluency and utterance fluency. Studies in Second Language Acquisition, 1-27.
https://doi.org/10.1017/S0272263121000899
Suzuki, S., Kormos, J., & Uchihara, T. (2021). The Relationship Between Utterance and Perceived Fluency: A Meta-Analysis of Correlational Studies. The Modern Language Journal, 105(2), 435-463.
https://doi.org/10.1111/modl.12706
Tavakoli, P., & Skehan, P. (2005). Strategic planning, task structure and performance testing. In R. Ellis (Ed.), Planning and task performance in a second language (pp. 239-273). John Benjamins Publishing Company.
https://doi.org/10.1075/lllt.11.15tav
Tavakoli, P., & Hunter, A.-M. (2018). Is fluency being ‘neglected’ in the classroom? Teacher understanding of fluency and related classroom practices. Language Teaching Research, 22(3), 330–349.
https://doi.org/10.1177/1362168817708462
鈴木駿吾(2018). 発話の諸側面に対する意識の質問紙尺度の開発と妥当性の検証_発話生成モデルの観点から(調査部門 英語教育関連の調査・アンケートの実施と分析). Eiken bulletin = 「英検」研究助成報告, 30, 221-239.
https://www.eiken.or.jp/center_for_research/pdf/bulletin/vol30/vol_30_p221-p239.pdf
鈴木駿吾(2022). コロナ禍でのダイナミックアセスメント – スピーキングの流暢さ向上を例に(pp. 64-73). In 小泉利恵(Ed.), 実例でわかる英語スピーキングテスト作成ガイド. 大修館書店.
鈴木駿吾(2022, November). 第二言語スピーキング能力とその評価:Is technology a friend or foe? [PowerPoint slides]. 中央大学国際情報学部.
https://www.teai-waseda.jp/wp-content/uploads/2022/12/20221124_Chuo_Invited_talk.pdf
東京都教育庁(2022). 中学校英語スピーキングテスト(ESAT-J)のお知らせ.
https://www.tokyo-portal-edu.metro.tokyo.lg.jp/pdf/speaking_esat-j_202204.pdf
東京都教育庁(n.d.). 中学校英語スピーキングテスト(ESAT-J) 令和3年度 確認プレテスト② 採点基準.
https://www.tokyo-portal-edu.metro.tokyo.lg.jp/pdf/speaking_grading03.pdf
文部科学省(2017). 中学校学習指導要領(平成29年告示)解説 外国語編.
https://www.mext.go.jp/component/a_menu/education/micro_detail/__icsFiles/afieldfile/2019/03/18/1387018_010.pdf