theanoでMNISTのnegative log-likelihood

theanoでMNISTを多層パーセプトロンするとき(日本語?)のnegative log-likelihoodをコストとして計算する式であるところの

NLL = -T.sum(T.log(p_y_given_x)[T.arange(y.shape[0]), y])]

という式について、ただし実用的には、

NLL = -T.mean(T.log(p_y_given_x)[T.arange(y.shape[0]), y])]

の式、の意味がよくわからず呆然としていた。Tはtheano.tensorのことです。
Getting Started — DeepLearning 0.1 documentationのNegative Log-Likelihood Lossの項やClassifying MNIST digits using Logistic Regression — DeepLearning 0.1 documentationのCreating a LogisticRegression classの項に出てくるやつ。

分解すると、
p_y_given_x: 出力層の値の分布。ラベルに対する確率分布ということになる。計算時にはこれは行列であり、rowがひとつのサンプルで、columnが0-9までのラベルに対する予測確率。
T.sum: 実際はT.meanを使う(値が大きくなりすぎてlearning rateに影響してしまうから)
T.log(p_y_given_x): logに入れるので値がすべて負になって0に近い値が高い確率になる
y.shape[0]: yがサンプル数の長さをもつ正解ラベルのリストで、shape[0]はサンプル数(=Nと書く)を与える
T.arange(y.shape[0]): [0,1,2,...,N] というリストを返す
[T.arange(y.shape[0]), y]: 行列から指定した座標の値をリストで取り出すためのnumpyの記法。M[取り出したい行番号からなるリスト(r_i), 取り出したい列番号からなるリスト(c_j)]に対して [M(r_1, c_1), M(r_2,c_2), ...] を返す。詳しくはIndexing — NumPy v1.10 Manualを参照
T.log(p_y_given_x)[T.arange(y.shape[0]), y]): 各サンプルが持つ長さ10の確率分布の配列から、正解ラベルの位置の値を取り出して長さNのリストで返す。つまり「各サンプルが正解ラベルに対して出力している確率」のリストを返す
\-T.mean(): マイナスが付くので正解に近づけば近づくほど正の値として0に近づく。したがって、NLLの値を0に近づけることが学習の目標になる。
という感じみたいです。

補記として、
learning rate などでfloat変数を突然出現させるとfloat64扱いされて(ほかをすべてfloat32で計算しているときには)弾かれるので、
lr = numpy.float32(0.01)
みたいに宣言したほうがいいのかもしれません(グローバルに宣言する(できる?)なら別なのだろうけど)。自分は課題提出のサーバーはそこでの型エラーを起こさなかったんだけど、手元で動かそうとしたらエラー吐かれた。どこをどう設定すれば解決するのかはきちんと調べてないですが、統一はしたい。

log2015-11-21

2015-11-21 日本科学哲学会シンポジウムのメモ

講演:保前文高「言語獲得の発達脳科学」

  • 脳科学と芸術、という本の中に論文がある
  • 言語発達脳科学とコンパクトに言ったりする
  • 言語科学教室というのは生成文法を中心の言語理論の専門家と
    • 脳を中心にアプローチする脳科学の専門家がいる
  • この人は脳を中心にしている
  • 昨年9月からそういう研究センターを作った

    • 生物系の遺伝学の人、保険の人、医学研の人、理研の人がいる
    • 遺伝的なバックグラウンドと脳の話を研究してる
    • センターと名前があるのはいいんだけど建物がない
  • 脳を知ることから言語機能がどうなのかを知りたいと考えている

    • 言語処理に関わる脳の領域の特定
    • だけではなく、脳の形成とともに生じる言語機能を探るというアプローチ
  • 脳はニューロングリア細胞と血管が集まって形成されている

  • ニューロンの電気的な活動が知りたい、とくに人におけるニューロンを知りたい
  • 脳の活動を調べる方法としては

    • 分類の図は Kuhl and Rivera-Gaxiola 2008 から?
    • 脳波、脳磁図MAG、fMRI光トポグラフィーNIRSがある
    • 赤ん坊の脳情報を取りたいが、赤ん坊に使える機器がほとんどない
    • fMRIは赤ん坊はあんまりよろしくないとされている
    • NIRS 近赤外光を当てて1-2cmの分解能で表面のマップを取れる
      • 今回後半でこの話をします
  • 脳のことを知りたいのはとくに赤ん坊

    • 3ヶ月の赤ん坊はまったく言葉がわからない
    • でも表情や視線や身体の動きや泣き声でわかる
    • 3ヶ月くらい過ぎると目を向けて注目できるようになる
  • de Boysson-Bardies 1996 で言語発達の過程(2歳まで)が整理されている

    • 伝統的にはピアジェから来ている
    • 10-12ヵ月で最初の言葉が出てくる
    • 「要約 ー 0歳から2歳までのコトバの発達の主要段階」という日本語資料
    • 生後1ヶ月の時点で言葉の対立のカテゴリー的弁別ができているっぽいということが
      • 1971年の時点で明らかになっている
    • 音声の識別は1~5ヵ月くらいにはきちんとできるようになっているとかいないとか
  • Dehaene-Lambertz et al. 2002,2006

    • 行動計測から脳機能計測へ
    • 音声を提示された時の3ヶ月次の脳の活動を計測
    • fMRIで計測すると左半球の側頭領域が活動を示した(成人と同じパターン)
  • Remez et al. 1981
    • 音声に似ていて音声ではない語(SWS)の弁別
    • Where were you a year ago?
      • 言われればわかる
    • 音声として受け取ると、脳の活動が増加する
    • わかるようになる前と後で活動の仕方が違う容認鳴る
    • Left posterior STS の活動
  • 光トポグラフィを付けて計測する
    • 48箇所
    • 音声やSWS(sign wave speech)どちらを聞いても左右両方の聴覚野が活動する
    • 3ヶ月児の左半球の側頭領域の後方部は、音声を特別な方法で処理している
  • 3ヶ月児の言語音知覚

    • 側頭葉における機能分化
    • 側頭葉、頭頂葉、前頭葉を含んだネットワーク
    • 発達過程にある脳そのものを知る方法がある
    • Homae 2014, 2007?6?くらいに図がある
  • 化石魚、ユーステノプテロン デボン紀、約4億年前

    • この化石を見て骨を見ると、どこに脳があったかを推定できる
    • ヒトとユーステノプテロンの脳の基本的な構造は変わっていない
    • 中脳、橋、延髄、小脳みたいな構造
    • ただし大きさの比率や見た目はかなり違う
    • イルカの脳がとても大きい
      • 基本的な形は少し違う、パーツの並びは同じ
    • ラットやウサギの脳はかなりつるつるで大脳皮質の皺がない
      • 脳溝に大きな違いがある
  • 脳溝と脳回の話、今回は特にシルヴィウス溝の話をします

    • 言語に特に重要になる部位
  • マウトナーニューロンの話
    • 魚が危険と反対方向に進むために筋肉に命令を出すようなニューロン
  • ヒトでも大脳のニューロンが反対側を支配していて、マウトナーニューロンに近い交叉性を示している
  • 失語症、ブローカの話
    • 左半球の前のほうが発話に関係があると特定した
  • ウェルニッケ失語
    • 発話できるが理解できない患者
    • 左半球の側頭葉上部の損傷を発見
  • Werinicke-Geschwind model
    • 話された言葉を復唱するときのモデル
    • 書かれた言葉を読むときのモデル
    • 古典的な言語のモデル
  • 最近はHickok-Poppel model
    • 背側経路と腹側経路
    • 今のところこれが割と信頼性の高いモデルになっている
  • ブローカ野はチンパンジーにもあるらしい
    • 場所は違うもののブローカ野に相当するものがある
    • 機能的な名称だけど
    • 藤田1997 あたりがブロードマンの地図の霊長類における比較をしている
    • ヒトはブローカ野、ウェルニッケ野、角回が大きい
    • チンパンジー以降とそれ以前でかなり違う様子
  • 現生人類がいつ言語的な脳を得たのか?

    • 頭蓋骨内腔の形状 intractanial endocast から脳の外形を復元する
    • Holloway 1974 が比較を書いている
    • ブローカ野周辺と角回周辺の体積が Homo erectus くらいから増えている?
      • 論争が未だにある
      • 結局いつからできたのかということはわかっていない
  • ヒトの脳ができるまで

    • もともとは一本の管みたいな形状をしている
    • 5-9ヵ月くらいから脳らしい形になる
    • Yamada et al. 2010 胚子期の標本
    • Kostovic and Vasung 2009 胎児期のデータ
    • シルヴィウス溝ができる時期がポイントになる?
    • 胎児の外界の音に対する反応を見たりする
  • 灰白質の発達
  • 脳の自発活動
    • エネルギーの60-80%はニューロンやグリアの間の信号のやりとり(自発活動)に使用されている
    • 意図的に何かのために使用していなくてもエネルギーを消費している
    • Raichle 2011 活動とエネルギー消費の図
  • 自発活動と事象関連の活動の関係

    • 事象関連の活動、つまり外部環境の一時的な刺激の処理には0.5-1%の増加しかしない
    • 負荷がどんなに高くても最大で5%くらい
    • ラットに音を提示をしたときの聴覚野の活動を計測した
    • 音を聞かなくても同じような活動を自発的に常にしているということ
    • 自発活動の取りうる集合に対して、事象活動はその小さな部分集合でしかない
    • Luczak et al. 2009
  • ここから10分くらいは最近やっている話

    • 光トポグラフィを用いて、赤ん坊が音声処理をする機能のネットワークについて考えている
  • 信号の時間的変化を取って、連続しているところを結ぶことで、機能的な結合性がわかる(?)
    • 脳自体が形成されていく過程で、反対側や遠いところでも関連性を持つようになっていく
    • 新生児から6ヵ月児になるまで、局所的から大域的(対称的)な機能的クラスタができていく
    • Homae et al., 2010
  • 脳における機能的なネットワークの中心性
    • 領域間の相関関係からネットワーク構造を求めて、構造の中心的役割を果たしている部位(ハブ)を探す
    • 音声を処理しているからといってハブ性の高いところが大きく変わるわけではない
    • ブローカ野は、他の広い領域から情報を受け取り、情報を伝える領域である可能性がある
    • つまり、状態によらずに中継地点となる領域になっている
    • 3ヵ月児のブローカ野とつながる領域は、成人と同じ
  • 脳の領域間の機能的な形成は、
    • 大域的なネットワークが局在している
    • ブローカ野は、内発的な機能構造の骨組み鳴る中心になっている
  • まとめ
    • 発達脳における情報の統合
      • 大域化とともに局在化が進んでいくが、その中心的役割を果たす(位置的にほとんど中継的)
    • 発達脳の形態形成
      • 特にシルヴィウス項の回りのブローカ野や、ウェルニッケ野、角回などがどのように形成されるのか
  • (質問:和泉)時間情報を含めたMerge機能がブローカ野にあるのでは?
    • 3ヶ月児くらいだと時間情報を含めた情報処理をしているという証拠があまりないのでこれから

log2015-11-20

研究室で週に一度、NLPに関わりそうな好きなテーマで発表をするという会をやっていて、今回の担当では言語に関わる脳の話をすこしだけしました。読んだ(紹介した)本は

脳はいかにして言語を生みだすか
武田ほか、2012年、講談社
http://www.amazon.co.jp/dp/4061531468

で、3章の半分くらいまでしか読んでいなかったので1,2章の内容をかいつまんで話すという感じになりました。
この本は書き方がしっかりしていてわかりやすいです。他に触れた本が多いわけではないですが、言語的な機能から脳の話をしている本の中では読みやすいほうではないかと思います。
あとは(本の紹介をするだけですが)、

進化言語学の構築ー新しい人間科学を目指して
藤田ほか、2012年、ひつじ書房
http://www.amazon.co.jp/dp/4894765942

の「言語障害と分子遺伝学から考える言語進化(岩本和也・笠井清登)」の章を直近で読みました。FOXP2遺伝子とかlanguagenomeの構想とか、まだまだ遺伝子的な側面からの知見は多くないようですが、言語障害者の遺伝子を機械学習にかけてパターンを取るような雰囲気のことができるんじゃないかという旨の話が書かれていて(最終的には言語障害の種類に対応する遺伝子の異常を同定できるようにする、すなわち言語に関わる機能に対応する遺伝子がわかるようにする)、面白そうでした。

夜はNIIで開催されていたTokyoCLの勉強会に参加しました。内容はしっかりとはわからなかったけど……。

ちなみに雑学テーマ発表会の最初の担当では言語獲得の話をしました。トマセロの本の紹介をしたり、用法基盤言語学なるものに触れたり。

log2015-11-13

logyyyy-MM-ddとしているものは研究や研究室での活動のログにしようと思います。
古いのは残していないので2015年11月からということで。発表や論文紹介などで使ったスライドはできれば公開したいのですが、論文の引用や画像がそのままだったりするので、必要があるときだけ(?)にします。

この日は午前に次の論文の紹介をしました。
Exploring Markov Logic Networks for Question Answering
Tushar Khot et al., EMNLP2015
http://aclweb.org/anthology/D15-1080
MLNを使って小学生程度の理科の選択問題を回答するというタスク。
問題文と選択肢の(prototypicalな)一階述語のグラフ表現に知識をalignmentしてネットワーク全体を計算するという手法でしたが、意外と(テキストやオンラインソースから構築したKBからの)知識の選択に失敗していて、そこがボトルネックになっていたようでした。正答率はせいぜい半分くらい。データセットも公開されています(論文参照)。

午後には次の論文の紹介をしました。
談話と論理 : 分節談話表示理論の紹介
白井, 2007
http://ci.nii.ac.jp/naid/110006381001
主に喋ったのは、談話構造系の理論である RST, DRT, SDRT の概要です。
RSTは核と従属項(訳語を知らないけどcoreとsatellite)の対応関係で説明しようとするもの、DRTは動的意味論として文脈を変化させるものとして文内部を構造化(主に変数のスコープや論理的な演算などが対象)しようとするもの、SDRTはDRTの文単位の構造に加えて文同士の修辞関係を構造化するもの。SDRTだと修辞関係のおかげで「最新の文が照応可能な文の候補」が限定されて、DRTで選択に失敗していた照応関係をうまく説明できるらしいです。あとは謬論理や分離的なモジュール化などが理論のポイント。
SDRTについての主著は
Logics of Conversation
Asher, N. and A. Lascarides, 2003, Cambridge University Press
ですが、とても厚い本で読むのに骨が折れています。ぽきぽき。
余談ですがAsherさんはLenls12で拝見して、そのときはMessage Exchange Gamesの話をなさっていました(日付的には2015-11-15のことだけど)。

マイケル・トマセロ『ことばをつくる』

  • 邦訳:辻幸夫ほか、2008年、慶応義塾大学出版会
  • 原著: Michael Tomasello. 2003. Constructing a Language: A Useage-Based Theory of Language Acquisition. Cambridge, Massachusetts and London, England: Harvard University Press.
  • 言語獲得の本です
  • 部分的には自分の言葉で言い換えていますが、当該章節からの引用が随所にあります
  • [こんなふうに書かれているのは私の独り言です]
  • [同じようなことが主張されている場合は省略しています]

第1章 用法基盤言語学 Usage-Based Linguistics (2015-09-08)

  • 全体の概要
  • 言語学的な変遷と、理論の骨子

現代の言語学分野における言語獲得の議論の変遷

  • Skinner(1957)は、他の行動を学習するのと同じメカニズムを用いて言語を学習するとした
    • ここでの言語能力は、「言語行動(verbal behavior)」と呼ばれる
    • 学習メカニズムは、人間以外の動物と区別されないものだった
    • 連合に基づく道具的条件付けによって言語の断片を学習し、帰納法の原理に基づく刺激の般化によって新しい事例を般化していく
  • Chomsky(1959etc.)は、刺激の貧困を論拠にして、生得的に人間が持つ抽象的な文法原理があると指摘した
    • これが生成文法理論
    • 子どもが経験する日常会話は情報量が少なく、また誤りが明示的でないことから、「生得的原理がなければ文法の習得にまで至れないはずだ」と考えることになる。この議論を刺激の貧困(poverty of the stimulus)と呼ぶ
  • この生成文法理論が流行し、子どもの言語的表象(言語表現)から大人が扱う統辞的な言語にはたどり着くことができない(You can't get there from here)ものの、子どもの言語能力の根底には大人と同じ抽象的文法が存在するだろうという議論に発展していった
    • [このあたりの議論、わかりづらかったので間違っている可能性があります]
    • すなわち、子どもから大人への言語能力の変遷において「表現」は連続していないものの、それを支える「抽象的原理」は連続している、とする
    • これを連続性仮説(continuity assumption)という
  • しかし近年(21世紀に入ってから)の発達心理学や認知科学の分野においては、「抽象的原理(=普遍文法)」ではなく「表現」が子どもから大人において連続していると説明する主張が提示され始めている
    • 論拠は2点ある。1点目は、子どもが単純な連合や機能よりも自由で強力な学習メカニズムを持っていること
    • 2点目は、大人だけでなく子どもの言語能力も含めて妥当に説明できる言語理論が存在すること
    • この2点が本書の重要な基盤になる

生成文法理論を否定するための2つの論拠と細分化

  1. 子どもの学習メカニズム - 2つに大別できる
    • 意図読みないし意図理解(intention-reading)という社会的スキル(人間特有 [脳の前頭前野が特徴?])
      • 他者との注意の共有する能力
      • 他者の注意や身振りに追従する能力
      • 身振りによって他者の注意を導く能力
      • 他者の意図的な行為を模倣的に学習する能力
    • パターン発見(pattern-finding)とカテゴリー化という認知的スキル(進化的には古い、人間以外も持つ)
      • 類似した対象やできごとからカテゴリーを形成する能力 [陳述的・内容的・開いたクラス?]
      • 反復する知覚や行為のパターンからスキーマを形成する能力 [非陳述的・機能的・閉じたクラス?]
      • 統計的な分析を遂行する能力 [数的な比較能力]
      • アナロジー(構造的写像)を生み出す能力
  2. 用法基盤言語学 - 概要
    • 文法はヒトがコミュニケーションをはかるにあたって使用した配列・規則がパターン化したものである
    • 生成文法が言語規則を代数的手続きであると考えるのに対して、用法基盤的なモデルでは言語構文それ自体を意味のある言語記号であると考える
    • 大人の言語能力を構文の構造化されたインデックスであると見なす

第2章 言語の起源 Origins of Language (2015-09-11)

第2章 目次

  • 2.0. 前置き
  • 2.1. 系統発生的起源 [=進化論的に言語の起源を見る]
    • 2.1.1. 霊長類のコミュニケーション
    • 2.1.2. 記号と文法化
    • 2.1.3. 言語普遍性
  • 2.2. 個体発生における起源 [=個体の(子どもの)成長において言語獲得を見る]
    • 2.2.1. 言語習得以前の乳児
    • 2.2.2. 意図理解に関する初期の能力
    • 2.2.3. パターン発見の初期スキル
  • 2.3. 子どもの最初の発話
    • 2.3.1. 初期の身振り(ジェスチャー)
    • 2.3.2. 初期の一語文
  • 2.4. まとめ

2.0. 前置き

  • ヒトの言語コミュニケーションの特徴は次の2点
    • 記号(シンボル)を用いる、そしてその記号は他者の注意状態に向けられている
    • 固有の意味を担う言語構文を用いる、すなわち文法を備えている
  • さらに、ヒトのコミュニケーション一般について言えることは
    • 集団ごとに異なるコミュニケーションの体系を慣習化している
    • その慣習をヒトの子どもは何年もかけて学習する
  • 一方で、他の動物のコミュニケーション手段は
    • 個体が学習して利用するようなものではない [本当? コミュニケーションに絞るならそうかも]
    • 集団に特有の体系があるわけではなく、種において典型的である

2.1. 系統発生的起源

  • 用法基盤主義的な立場から、系統発生的起源について次のことが主張される
    • 文法の発生は人類の進化においてごく最近のものである
    • 言語そのものに関係する遺伝子レベルの出来事はひとつもない
    • [これは一見すると驚くべき指摘だし、生成文法学者は猛反発するのだろうけど、理論として必要になるのは「意図理解」のための遺伝的能力なので、主張としては一貫している。ただし失語症のように「言語能力が局在化しているように見える」点についてどう説明するのかが不明]
    • [「言語能力そのものを担っているような遺伝子は無い。言語能力は複合的なものなんだ」ということなので、通言語的な説明項が要らなくなって妥当に見えるのは理解できる]
2.1.1. 霊長類のコミュニケーション
  • ヒト以外の霊長類が行うコミュニケーションは、
    • 2項関係的な社会的やりとりを統制するのに用いられる
    • 相手の注意を外部のものに向けるなどの3項関係的な目的では行われない
    • 警戒音の使い分けなどに記号的兆候が見られるが、類人猿が行った形跡がなく、ヒトに連続していない
    • 社会的に構築されたもの・個体が個別に学習するものではなく、種に普遍的なものである
  • [この節の議論で注意すべきだと思われることは、
    • ヒトの言語の進化的な祖先を他の動物に見出すことができない
    • ヒト以外の動物が行うコミュニケーションの3項関係的な成り立ちを否定している
    • したがって、ヒトが行うコミュニケーションがすべて3項関係的だとは限らない
    • など。言語の祖先を他の動物に見出だせない、と主張している点が最も重要かと思われる
    • いずれにせよこの節の論点だけで膨大な議論が必要。たとえばこのトマセロの立場は、哲学において説明される「志向的記号としての言語記号」と両立しない]
2.1.2. 記号と文法化
記号について
  • 20万年ほど前の現代人の出現とともに、ヒトは他者を初めて意図主体・心的主体と理解するようになる
    • という説 [本書全体が仮説なのは違いないが、特にこの部分は文化人類学的な色が強く証拠が得られにくいため、眉唾]
    • [たとえば生物言語学では13万年前とする向きもある(生成文法的機能の単一起源を説明するために出アフリカの時期に合わせている)]
    • [つまるところ心の理論のこと]
  • ヒトの言語記号の特徴は
    • 慣習的形式だけでなく使用法も併せて文化的に(ミームのように模倣的に)学習される
    • 模倣により慣習が共有されるという意味で、使用者に「間主観的」に理解される
    • 他者の注意を外部の事物に向けるために3項関係的(指示的)に用いられる
    • 同一の事物に対して異なる表現を与えることが可能であるという意味で視点依存的(perspectival)である [目的、分節化に基いている]
  • 言語記号の慣習的な形式と使用方法は、複数の世代にわたってその文化・集団において有用だったために慣習化されたものである
  • 視点依存的な言語使用は、より細かな意図理解・注意の共有に寄与した
文法化について
  • 文法化・統語構造化は文化的・歴史的プロセスであり、生物学的プロセスではない
    • 語法や構文は、すべて即座に作られるのではなく、人々がそれらをコミュニケーションにおいて使用し、修正を加えつつ長い時間をかけて慣習化させていくことで生まれる
  • 頻繁に用いられる表現が高度に予測可能となるので、そのような表現は短縮される
    • 特殊な用法として残る。たとえば英語で不規則変化する動詞を想像するとよい
    • 一方で頻度が高くない表現は学習機会が少ないので、覚えやすさのために規則化の圧力を受ける
  • このような文法化の説明によって、諸言語の類似性と相違性は次のように説明される
    • 類似性は、ヒトという種に普遍的な認知能力・情報処理能力・推論能力に基づく
      • [たとえばヒトは普遍的な行動として指示と叙述を行うため、どの言語も名詞と動詞を持つ]
      • [閉じたクラスに属する語は認知的枠組みを反映するものが多いので類似性があると思われます]
    • 相違性は、語・文法が異なる言語共同体において慣習化されることに基づく
      • [生成文法が見出したい文法的な普遍性は、「文法を生み出す認知的機構」の側の普遍性にすぎない]
2.1.3. 言語普遍性
  • 言語類型論では、あらゆる言語に存在するような文法範疇や構文はほとんどないという主張で一致している
    • 関係節、助動詞、受動構文、時制標識、前置詞、格標識、接続法など様々あるが、どの言語も何かを欠いており、どの言語にも共通するようなものはない
    • 言語学的分析はヨーロッパ言語が起点であるように見えるが、もし仮に太平洋の諸言語から分析を始めていたら、現在の言語理論は大きく異なるものになっていただろう
  • 言語普遍性とは、特定の文法や構文という形式の普遍性ではなく、コミュニケーションや認知といった人間の生理学的特徴の普遍性なのである
    • 一見すると普遍的に見える形式も、人間の認知的特徴・伝達の必要性などで説明できる

2.2. 個体発生における起源

  • 個体が言語を学習する上で重要な役割を果たすのが意図理解のスキルである
    • このスキルはおよそ1歳前後にならないと発現しない
  • 言語習得に必要な社会的スキルを挙げると [1章の列挙と異なる整理がなされている]、
    • 共同注意フレームの構築 [言語理解において重要な第一の側面]
    • 伝達意図の理解 [言語理解において重要な第二の側面]
    • 役割交代を伴う模倣 [言語産出において重要な側面]
2.2.1. 言語習得以前の乳児
  • 子どもが1歳前後から言語を理解・産出し始める理由について具体的な研究はない
    • [あくまで2003年時点の話]
    • [概念や心の理論の獲得が言語獲得期より先か、両者が相互的に発達するかについては、意見が分かれている(Wikipedia:言語獲得より)]
  • 物や出来事の概念形成が生後4,5ヵ月から始まるという点は知見として一致している
  • 子どもが母親と共同注意に携わる最初期のスキルが、その子どもが言語理解に関するスキルと高度に相関することがわかっている
  • [なお、本文中で「子ども」と「乳児」に明確な使い分けがあるのかどうか怪しいため、まとめでは深く考えずにそのままの形で書いています]
2.2.2. 意図理解に関する初期の能力
  • [ここから具体的なスキルの話]
  • [先にまとめを引用しておくと、] 子どもは1歳ごろから他者を自分と同様に意図を持つ主体であると理解し始める。意図理解は2つの側面からなる。第一に子どもは外界の物に対する他者の意図状態を、自分を含めた協調関係「共同注意フレーム」のもとで認識するようになる。第二に子どもは共同注意フレームのもとで相手の伝達意図が持つ複雑な構造を理解する。そしてこの理解のもとで子どもは相手の行動を模倣し、自ら言語を産出できるようになる。
共同注意フレーム
  • 子どもと大人のコミュニケーションでは、お互いの注意が相手や共通の対象に向けられており、ひとつの協調関係を形成している。子どもはこの協調関係を1歳ごろからモニターできるようになり、ここではその関係を共同注意フレーム(joint attentional frame)と呼ぶ。
  • 共同注意フレームが持つ重要な特徴は2つ挙げられる
    • フレームは互いの意図に基づいて形成される目的指向的なものであり、目的から外れる対象はフレームに含まれない
    • 自分の役割もフレームに含まれるため、参与者は協調的な相互関係をメタ的に把握すると言える。したがって役割関係はパターンとして共通の表象フォーマットを持つことになる [動作の主客関係など]
伝達意図の理解
  • 共同注意フレームを形成するために、子どもは相手の伝達意図を理解しなければならない
  • 自分の意図状態に対して働きかける主体として他者を理解する必要がある
  • したがって伝達意図の理解しているとき、次のことを理解していることになる
    • 他者は「私がXに対する注意を共有すること」を意図している
  • この定式化には重要な点が2つある
    • 埋め込みの構造を持っていること
    • Xに様々な発話行為と具体内容を代入することができること
  • この定式化において挨拶・感謝などの遂行文を理解することは次のように説明される(例は感謝)
    • 感謝を言われそれを理解する側をA、感謝を言う側をBとすると、
    • <「Bが感謝を表現することに対してAが注目するようにBが意図している」ということをAが理解する>が遂行文の理解
    • [命題内容を伴わないような遂行文はもっと原始的な行為なのではないかと疑ったが、遂行文そのもの定義をきちんと把握していなかったので流した。おそらく言語表現である時点で私が勝手に想像した原始的なものからは遠ざかっており、言語表現ではない身体的な表現だけが原始的であるように思われる。これは2.3.1.節の儀式化とおそらく同じもの。]
  • 伝達意図を理解し、共同注意フレームを持つことで、未知語が何を指示しているのかを学習できるようになる
役割交代を伴う模倣
  • 子どもは他者が意図的活動をしていることを理解することで、同じ意図のもとで行動を模倣することができるようになる
    • たとえば相手の意図行動が達成されず失敗した様子を観察させても、子どもは同じ意図のもとで行動を再現し、達成することができる
    • あるいは意図の伴うように見えない偶発的行動を観察させても、それを模倣することはない
  • 単純な意図動作の場合は模倣するだけでよいが、言語記号を伴う場合は「役割交代」が必要である
    • 自分に向けられた記号を単に模倣するだけでは、同じ記号を自分自身に向けることになってしまう
    • 大人が子どもに対して記号を使うのと同じ仕方で子どもが大人に記号を使わなければ、意図行動は再現できないことになる
    • したがって、子どもは役割の交代を前提とした模倣を行う必要がある
    • 逆に言えば、役割交代を伴う模倣ができている時点で、相手の意図行動を間主観的に [客観的に、メタ的に] 理解していることになる
2.2.3. パターン発見の初期スキル
  • 言語学習以前の乳児は、視覚のみならず聴覚においても高いパターン発見能力を備えている
    • この能力によって、言語的刺激の中から抽象的な文法のパターンを発見し、意図行動と結びつける
  • 言語習得に関わるパターン発見には二段階ある
    • 言語形式の具象的なパターンを発見する(音韻など)
    • 意図行動の抽象的なパターンを発見する(使用場面など)
    • 両者のパターンを結びつけることで初めて言語表現の正しい使用が学習できる

2.3. 子どもの最初の発話

  • 2.2.節で述べた言語獲得のスキルは、次のような動機から促進されるだろう
    • 他者とコミュニケーションをとりたいという欲求
    • 他者との同質性を得ようとする欲求
    • [どちらかというとこれらは子どもに限らず言語共同体の構成員が普遍的に持つ欲求?]
  • 言語獲得期の子どもは、大人(おもに母親)に対して次の2つの動機から身振りや発話を産出する
    • 物や出来事について何かをさせる命令
    • 物や出来事について注意を自分と共有させる宣言
2.3.1. 初期の身振り(ジェスチャー)
  • ヒトの乳児には主に3つのタイプの身振りがある
    • 儀式化された身振り
      • 身振りによって大人に自分の要求が伝われば望む結果が得られるということを学習する
      • たとえば「ばんざい」をすれば大人が自分を抱き上げてくれる
      • この学習過程はヒト以外の霊長類が身振りを学ぶのと本質的に同じである
      • 伝達意図の理解や模倣を伴っておらず、[他者と共有されないという意味で] 記号的ではない
      • [記号の定義が明確にされていないが、おそらく「間主観的に理解される表現」くらいの意味]
    • 直示的身振り
      • 相手に物を提示したり指差しをしたりすること
      • 3項関係ではあるものの、意図理解を伴わない場合もある
      • 儀式化された身振りとして学習する場合も、意図理解を伴う模倣として学習する場合もある
      • 儀式化と記号化が混在しうる身振りとして区別されている
    • 記号的身振り
      • 指示対象と換喩的あるいは累増的に結びついた伝達行為
      • 両腕を広げることで飛行機を、ふーふー吹くことで熱いものを表す、など
      • 身振りを行うさいの大人の伝達意図を理解したうえで模倣して用いている
  • 記号的身振りの類像性・恣意性について
    • 飛行機の例だと、翼と腕の類像性があるからこそ記号として習得しやすいと考えられる
    • しかし、そうした類像性はあまり関係ないとする主張もある。その根拠は次の3点
      • 手話を学ぶ聾児は手話記号の多くが類像的であることで容易に習得できるわけではない
      • ヒトの乳児は指示的に使われる恣意的な身振りを語の習得と同じくらい容易に学習できる
      • そもそも18ヵ月児くらいまでは大人の伝達意図の理解に類像性を利用できない
    • 結論として話し言葉の記号と同じような恣意性を持っているとかんがえられる
    • このような記号的身振りと話し言葉の類似性は、両者の能力の強い相関からも説明される
  • 聾児は健聴児が音声言語を身につけるのと同じような時期に手話を習得していく
  • ということで、記号的側面がヒトの言語獲得の鍵になっている
    • 形式的パターンに意図的パターンを結びつける、という前述の説明への補強となる
2.3.2. 初期の一語文
  • 子どもの最初の言語表現の動機は、叙述(共有されている指示対象について述べる、あるいは聞き手の注意を新しいものに向ける)・命令・質問が中心だと言えるが、一語文のような最初期の段階では言語表現は指示的側面を主張するにとどまり、言語行為としての機能は十分に差異化されない
  • トマセロは自分の娘が言語発達の初期に使用した一語文について述べているが、その多くは始めはある動作とともに使われ、その後でその動作に関わる対象の指示に使われたとしている
  • 言語を問わず多くの子どもは、「際立った場面経験」について話すことが多い。たとえば、
    • 人や物の存在・非存在・出現
    • 物の交換や所有
    • 人や物の移動や位置
    • 状態およびその変化
    • 人の身体的・心理的活動
  • したがって、先述した動機としての発話行為と、直前で挙げた具体内容を組み合わせて考えれば、子どもは言語獲得の初期において次のような目的で一語文の発話を行う傾向があると言える
    • 物の存在や出現、状態などを要請・指示・描写する (sth)
    • 物が関与する動的な出来事を要請・描写する (up, down, on, off, in, out, etc.)
    • 人の活動を要請・描写する (eat, kick, draw)
    • 基本的質問をする(Whats-that? Where-go?)
    • 遂行的表現を使う (bye, thank-you, yes/no)
  • ただし言語においてどの表現を一語文として選ぶかという点には恣意性がある。多くは大人の言語表現を真似るのだから、大人が頻繁に利用し意図の見えやすい表現から用いるようになっていく
  • つまり表現する動機や内容にはある程度の普遍性があるものの、表現に用いる品詞については言語によって揺れがあるようである
  • また、大人は一語文を多く話すわけではないから、それを耳にして利用しようとする子どもは大人の表現のどの部分を抜き出して一語文として用いるかという問題がある
    • 分析や抽出をする前の段階では、複数語の連続した表現を凍結させて一語文として用いる
    • 音声の連鎖だけでなく、関与する伝達意図についても分節化を行って、意図に対応する言語表現を学習していくことになる
    • 英語のように孤立語の性格がある程度はっきりしている言語ならば形式表現の分節化はさほど困難にならないが、孤立語の性格が弱い言語(他言語では文相当の表現能力を持つにもかかわらず一語で表現するような言語、たとえばカナダのイヌイットが話すイヌクティトット語が該当する)では言語表現の全体から部分的な言語要素を獲得しなければならない
    • 一方で子どもには獲得した言語要素を組み合わせて発話するように言語学習を進めていく能力がある
  • 要点をまとめると、次のようになる
    • 子どもは大人の発話の全体を大人の意図とともに聞く
    • 大人により発話される表現は言語によって分節化の難度が異なっている(英語のような孤立的性格の強い語に慣れすぎるとこの点を見落とす)
    • 子どもはそうした表現の分節化と意図の分節化を同時に行い、抽出された言語要素を意図の単位と結びつけて学習する
    • 子どもは初期の発話として、分節化済みの言語要素を一単位とする一語文か、分節化以前の凍結された言語表現を使用するが、動機を表現するためのイントネーションなどは差異化されないままである
    • 発達に伴い、差異化や複合化を進める。最初から一度に複数の語を用いることができないのは、[注意などの?] 処理能力の問題と考えられる

2.4. まとめ

  • 言語の系統発生的起源について
    • 言語の記号的な側面は、文化的な事物に対するヒト特有の生物学的な適応、すなわち他者に対する心の理論に由来している
    • 言語の文法的な特性は、他者とのコミュニケーションを目的としてパターン化された仕方で言語記号を使用することに由来する
  • 言語の個体発生的起源について
    • 子どもは大人とともに共同注意フレームを構築し、そのフレームの中において発話が表現する伝達意図を理解する。そして自分に向けて使われていた言語的慣習を習得するために役割交代を伴う模倣を行い、言語を産出する
    • 子どもが最初に産出する記号は、さまざまな種類の身振りと言語的な一語文や凍結表現である。身振りは儀式的・直示的・記号的という異なる形式で現れる。言語表現は意図とともに分節化され、小さな要素(語)が抽出されていくが、それと同時に大きなパターン(構文)の学習も行い、複雑な文の構築ができるようになっていく(これは次章のテーマになる)

3章 語彙 Words

3章 目次

  • 3.0. 前置き
  • 3.1. 初期の語彙とその使用
    • 3.1.1. 最初期の語
    • 3.1.2. 学習率
    • 3.1.3. 語の意味
  • 3.2. 語彙学習プロセス

3.0. 前置き

  • 語彙学習を検討するにあたって注目すべきこと
    • 多くの場合、大人は物の名前を逐一子どもに教えたりしない
    • ものの名前以外の語を指示して名前を言うような遊びはない
      • 名詞の名前を指示する遊びはあっても、動詞やその他の品詞はないだろう
    • 指で示して名前を言うような遊びでさえ、その指示対象の境界は不明瞭である
      • にもかかわらず、子どもは語彙を学習する
  • この章では、語彙学習の社会-語用論的理論を採用して検討する
    • 語彙学習はもちろんこれのみによってなされるわけではない
    • 獲得に関わる能力として、発話の分節や概念化の能力が要る
    • 言語的要因として、他の語との関係性から獲得する場合もある(対義語や類義語)

3.1. 初期の語彙とその使用

  • 語彙学習の説明は、伝統的に内容語に関するものがほとんどである
    • もちろん我々は機能語の説明を避けるわけにはいかず、その説明は後の章でなされる
    • [内容語: 名詞や動詞といった開放類の語]
    • [機能語: 冠詞、法助動詞、代名詞などの閉鎖類の語]
    • とりあえずこの章では開放類について扱う
3.1.1. 最初期の語
  • Genter(1982)によれば、世界の多くの言語で子どもは他の品詞よりもまず名詞を早く学習する
    • 気をつけなければならないのは、もし動詞のほうを多く使っているように見えても、それは動詞の生起頻度が本来的に高いからであり、使用頻度は少ないが学習済みであるという意味での語彙として名詞が優位であると考えられるという点である
  • またGenter(1982)は、発達における名詞の優位性について「自然分割仮説(Natural Partitions hypothesis)」を提示している。その仮説は、「名詞が典型的に指示する具体物は、行為や属性などよりも個別化させやすい対象であり、その個別化のしやすさが名詞の優位性を説明する」というものである。具体物は空間的に有界であり視認しやすいが、行為や状態は時間的な分布を持っているために指示対象にしづらいことを根拠にしている
  • Genter and Borodisky(2001)では、Genter(1982)を洗練させて、「認知的優位性」と「言語的優位性」を両端とするスペクトルの中に各品詞を位置づけて説明している。認知的優位性の高いほうから品詞を上げると、「固有名詞、具象名詞、親族名称及び関係を表す語、動詞、空間前置詞、決定詞と接続詞」となる。またこのスペクトルは、認知的優位性の側に開放類、言語的優位性の側に閉鎖類を据えているとも言える
  • 自然分割仮説で説明が足りていないような事実を挙げると、
    • 子どもが学習する最初期の語は実は名詞ではなく挨拶や返答のような行為遂行的な語であるが、これらの語は明らかに言語的ではなく認知的な優位性によって個別化されている(指示対象を持たないが、周囲の状況や要請に対する個別化がある)という点で自然分割仮説に一致している
    • 子どもが学習する名詞は、実際には具体的事物を持たないものも多い。「犬」「椅子」などは明確な指示対象を持つが、「ごはん(食事)」「台所」「夜」といった語は空間的あるいは時間的に指示可能な境界を持つわけではない。したがって個別化が容易とは言えないが、獲得の段階は比較的早い。これは個別化・概念化のしやすさよりも生活において生起する頻度に依存している例と言える。[実際は、個別化・概念化のしやすさと生起頻度の掛け合わせがある閾値を超えたら(自分が指示・使用できる語として)学習される、というような感じだと思われる]
    • 直前で挙げた事実と意図理解の観点を併せて考えると、たとえ個別化が容易な状況でなくても、大人の意図表示の助けによって指示事態を同定できるのであればその語は容易に獲得されると言える。したがって自然分割仮説に修正を加えるなら、「子どもは大人の伝達意図が最も読みやすい状況下において一番容易に語を学習する」とすべきだろう
  • [指示事態や機能が理解されたときにその語が学習されるとする。指示事態や機能を知るためには、語の使用者の意図を理解すること、すなわち「この語はこれを指しているのだ」と知ることが必要で、その過程の達成の難易度は意図の掴みやすさ(複雑な知覚や推論を必要とするか)や頻度、認知的個別化の容易さに依存している]
3.1.2. 学習率
  • 言語を学習する最初の5年間に子どもは平均すると起きている時間の1-2時間の間に新しい語を1語学習している
  • 生後18ヵ月で語彙の急増が起こるとしている研究者もいるが、その要因ははっきりせず、急増すること自体の定義も曖昧である
  • [語彙獲得のための派生的な方法を習得してからは指数関数的に伸びる傾向はあるが、その方法(ひとつでない)は身体的な発達に還元されないように思われる]
  • つまるところ今の知見としては、子どもは1歳から10代の始めまで加速度的に語を学習しそこで収まりを見せる、ということだけが確言できる
3.1.3. 語の意味
  • 語の意味をどのように定義するかという問題においては、まず古典的主張としてNelson(1974)のような「機能的コア」に着目する説があった。それ以降はあまり研究がなされてこなかったが、認知言語学を参考にすることで進展する可能性がある。
  • 認知言語学による新しい理論的観点からの意味の議論においては、多くの語の意味は単独で定義できず、より大きなコンテクストの中で理解されるとしている
  • 子どもにおける認知表象の研究もあまりなされていない。Tomasello(1992)は乳児の認知に関するPiaget(1952,1954)の議論を引き合いに出して、行為や出来事を表す初期の語の基礎となる概念化は、空間・時間・因果・物体(・所有)という基礎的概念要素によって明らかになると提案している[重要]
  • [空間と時間、と聞くとカントを思い浮かべるし、やっぱりカントはこの点において正しかったのだなぁと不勉強ながら感じる(概念的な形式化の基礎、という文脈)]
  • 動詞の学習の順序を適切に説明する理論は今のところない
  • 英語では、幼児は形容詞を1つのカテゴリーとしては持ち合わせていないとNelson(1976)で述べられている
  • 処格(位置関係を表す)の前置詞の学習順序については、単純なもの[主観的なもの?]から始まり、相対的な位置を示すもの、直示的であるような複雑なものなどの順になっている[らしい]
  • 多義語の意味については、すべてが一度に獲得されるのではなく、ひとつの意味について学習して使えるようになってから、別の意図において使われているのを観察して多義性を拡張していく順序になっている
  • 結局のところ子どもの初期の語の意味をどのように記述するのが適切かという問題は解決していないが、認知言語学のアプローチから次が有用であると考えられる
    • Langackerをはじめとする多くの研究者が利用しているイメージスキーマの図(円や矢印を用いて場所や主体、関係性などを示すもの)のような類像的な記述
    • プロトタイプや放射状カテゴリーとして記述されている、語の使用の複雑なネットワーク

3.2. 語彙学習プロセス

(つづく、2015-09-28)

List/ACL2015

ACL2015で気になった論文です、anthologyのページで検索かけて見つけています。調べたものがあるたびに追記。列挙しているだけなので全部きっちり読んでいるわけではないです。

Knowledge-

Representation-

Grammatical-

List/arXiv:1507