平成から令和で「なじみ深さ」が変わった単語とは NTTが令和版単語親密度データベースを構築:言語心理学や言語教育などに活用
NTTは、約16万3000語からなる「令和版単語親密度データベース」を構築した。約20年前に作成した、約7万7000語からなる平成版データベースを更新。さらに語彙数調査を実施して、各学年・年齢での語彙獲得状況をモデル化した。
NTTは2020年6月3日、約16万3000語からなる「令和版単語親密度データベース」を構築したと発表した。単語親密度は、単語のなじみ深さを成人による評定実験によって数値化したもの。約20年前に作成した平成版データベースを更新した。
さらに、小中高校生を含む約4600人を対象に語彙(ごい)数調査を実施して、各学年・年齢での語彙獲得状況を、単語親密度に対応付けてモデル化した。これを基に、令和版語彙数推定テストを作成した。
言語心理学や言語教育などの基礎指標として活用
NTTは単語親密度などの基盤的言語資源の構築に取り組んでおり、約7万7000語からなる平成版単語親密度データベースが公開している。このデータベースは、構築から時間がたっており、単語親密度自体が時代とともに変化している可能性や、「インターネット」や「コンビニ」といった新しい単語に対応していないといった課題があった。また、既存の語彙数推定テストについても、推定できる語彙数の上限が単語親密度データベースの単語数に依存し、7万7000語以上の語彙数を推定できないという問題があった。
令和版単語親密度データベースを平成版と比べると、両者に強い相関があり、多くの単語は20年以上たっても親密度に大きな変化がなかった。ただし、一部には、親密度が大きく変化した単語もあった。例えば、「アナフィラキシー」や「マニフェスト」「熱中症」といった単語は親密度が上昇しており、「ミリバール」や「純毛」「コレクトコール」といった単語は親密度が低下した。
小中学生で急激に語彙数が上昇
今回のデータベース構築に当たって児童や生徒を対象に語彙数調査を実施したところ、特に小中学生で急激に語彙数が上昇することが分かった。成人でも、年齢とともに語彙数が上昇することが確認できた。
年齢にかかわらず、親密度が高い単語ほど知っている人の割合が高くなる傾向にあり、年齢が上がれば上がるほどこの傾向が顕著になることが分かった。ただし、小中学生に限ると、比較的親密度が高い単語でも、知っているかどうかにばらつきがあった。
NTTは、今後、自治体と協力して学童期から語彙数調査をより広範に進めるとしている。そして語彙数と読解力や学力全般との関係を分析し、効果的な学習支援の実現を目指すという。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- SBT、ダイキンらと共同で「ストレス度を数値化」して職場環境の改善などにつなげるIoT実証実験を実施
ソフトバンク・テクノロジーが、ダイキン工業や青山キャピタルと共同で、職場環境と人が感じるストレスの関係などに関するIoT実証実験プロジェクトを実施する。IoTシステムで人のストレス度を可視化し、職場環境の改善などにつなげる。 - 成功した人が幸せになるのではなく、幸せな人が成功する――IoTで幸福度は定量化できるのか
つかみどころのない「幸福度指数」をなんとか定量的に計測できないか。そして、それを職場の幸福度向上に生かせないかというプロジェクトがある。日立製作所フェロー・理事、IEEE Fellow、東京工業大学大学院情報理工学院特定教授の矢野和男氏に聞いた。 - 酒造りのノウハウをIoTで数値化 データと映像で品質向上と技術伝承――寒梅酒造、NTT東日本らと実証実験
日本酒蔵の寒梅酒造は「もろみ仕込み」の工程をセンサーで計測し、遠隔監視する実証実験を開始。職人の経験で受け継がれてきた酒造りのノウハウを数値化し、酒造の効率化や技術伝承の簡易化を図る。