読者です 読者をやめる 読者になる 読者になる

latex で table 書くときにね?

よくひとつのセルに改行含めた表現を入れたくなるじゃないですか、こんなふうに

f:id:liephia:20160927034932p:plain

ここでは \shortstack{All you need is \\ love} って書いてます。見るからに美しさに欠けており、内容の上に余白ができないかなあと思って困ってたんですが(そもそもバリバリに罫線を引くのが間違っているという説はあるとして)、簡単に解決したのでメモをします

f:id:liephia:20160927034944p:plain

\shortstack{\\All you need is \\ love} でなんとかなりました。vspace とか入れようとしてる場合ではなかった。先頭に改行で良かった感じ。そもそも \shortstack 使わずに別の行にしちゃえよという意見もあるかもしれない。それもわかります。次はそうしようと思います。メモですメモ。

ということで(?)近況は EMNLP 2016 Workshop on Uphill Battles in Language Processing に行くことになりました。バトルをしてくるのだ。

追記
けっきょく booktabs.sty を使うのが最近の流行りっぽいし見栄えが良いです

pdftotext して持ってる論文の文字列検索をできるようにしておく

本文の通りのやつのメモです

1. pdftotext を入れる
2. 論文の pdf が大量に入っているディレクトリで
$ for i in *; do pdftotext $i; done
みたいなことをすると .txt が大量に吐き出される(ls でやろうとすると空白混じりのファイル名の読み取りで困ったのですが、単に * でいいみたいです(shell によるかも))(エラーが出るけど気にしない)
3. 必要なら専用のディレクトリを作って txt ファイルたちを移動
4. 検索は例えば自分は .zshrc に
alias dirsearch='function hoge(){grep --color -r -i $1 .;}; hoge'
のように書いて、
$ dirsearch 'this is a pen'
をしています
5. 今のままだと段落ごと出てきて微妙に不便なので、必要なら出力をパーサに食わせて整形してから出すみたいなこともアリかも(面倒なのでやってない)

「自分が持っている論文を対象にする」というのは意外と大事で、「興味がある分野の論文から検索できる」とか「ある程度信頼できる文章から検索できる」とか良いことがあるっぽいです
(pdftotext の日本語抽出はたぶんできると思うので必要ならやってみてください)

蛇足ですが、英語であれこれ書くときは
springerexempler (Springer Exemplar - Scientific Terms in Context) や oxford collocations dictionary あたりを使うのが良いっぽいというのが最近の感想です(他におすすめがあったら教えてください)

tikz, node, text, graphicx

%% \usepackage[dvipdfmx]{graphicx}
\usepackage[pdftex]{graphicx}

dvipdfmx を入れっぱなしで、 tikz の node 内の text の centering がおかしいことになっていた。
graphicx 自体をコメントアウトするか、 option を pdftex にする。
出力の仕方に応じてちゃんとオプション変えましょうとかそういう話。

参考
graphicx - TeX Wiki

2016年前半くらいの論文のメモ

無所属?

ICLR2016

NAACL2016

ICML2016

ACL2016

JSAI2016 のしおり

気になるリンク集です

2016-06-06

latex, itemize, 項目内の行間

  • itemize における同一項目内での行間の設定の仕方がよくわかっていなかった
  • \parskip とかではない
  • たとえば \fontsize{12pt}{15pt}\selectfont をするとフォントサイズが 12pt へ変わってくれるわけだけど、15pt の部分が行送り(行の最上部から次の行の最上部、フォントサイズ+行間のこと)を担っていて、\parskip をいくら変えてもこちらは変わらない
  • 長いときは(?){\fontsize... \par} にしないと機能しないっぽい http://texblog.org/2012/08/29/changing-the-font-size-in-latex/
  • 物理的に大きくしたいときはここやら \baselineskip を変えるとよい
  • beamer poster の原稿内でころころ fontsize を変えていたのだけど、その都度 \baselineskip もリセットされてしまう?らしい。一行で収まる item がほとんどだったから、折り返しのある item の行間が突然狭くなってしまって驚いた。ちゃんと設定しておく必要がある
  • 未だに latex の細かいことをよくわかっていないのだけど出力が良ければまあ良いという感じで諦めている
参考

学振DC申請体験記(提出直後版)

  • 学内の締め切りが過ぎたので、学振DC申請の体験記みたいなものを書きます
    • DC1 です
  • 申請書は採否が出たら公開します、今は忘れないうちに記録を残します
    • (追記3)採用されたらにしてください
  • 不採用だと説得力が出ないので、採用されてるといいな
    • (追記1)不採用Aだったよ!!!!!!!
    • (追記2)評定は 能力/実績/計画/総合 の順に 4.33/3.50/3.83/3.50 、Tスコア 3.235 でした
  • 私が出した分野の話などもまたいずれ

まとめ

  • 読みやすく書く

0. 情報収集

  • http://www.slideshare.net/tonets/10tips28
    • 同じ方の書籍『学振申請書の書き方とコツ』は、ウェブ上で公開されているスライドに説明が付いたような感じです
  • などなど、検索するとたくさん出てきます
  • 自分と近い専門の先輩(採用されてる人もされてない人も)から過去の申請書を見せてもらうといいです

1. 見出しを作る

  • 中身を書き始める前に、「何を書けばよいのか」を整理する目的
  • たとえば「現在までの研究状況」には、「①これまでの研究の背景、問題点、解決方策、研究目的、研究方法、特色と独創的な点について当該分野の参考文献を挙げて記述してください」とある。素直にこれに倣って次のように見出しを作る
    • 「これまでの研究の背景」
    • 「問題点」
    • 「解決方策」
    • 「研究目的」
    • 「研究方法」
    • 「特色と独創的な点」
    • あと参考文献
  • ただしこれだと「何の問題点」で「何の問題点に対する解決方策」で「何の研究目的」なのかが不明瞭。申請書の指示が悪いと個人的には思うのだけど、自分は次のような見出しにした
    • 「これまでの研究の背景」
      • 分野やテーマの背景と問題意識
    • 「既存研究とその問題点」
      • 分野的な背景と問題意識に対する既存研究とそれが抱える問題点
    • 「申請者の研究における解決方策」
      • ここから自分のアイディア。目的や方法よりも抽象的に書く
    • 「研究目的」
      • 自分の現在までの研究目的
      • 「本研究の目的は〜」と明示的に書いた
    • 「研究方法」
      • 「次のような手順で」とか「次のことを行った」とか
    • 「特色と独創的な点」
      • 「本研究の特色は、〜である」
      • 「〜の点で独創的である」
  • ②についても3.についても同様
  • 参考文献はマジでちゃんと書くべし
    • みんな言うことだけど、審査は減点法みたいなものです、たぶん
    • おおよそテーマについての差別化が難しい場合は、フォーマットや日本語の書き方など細かいところで差をつけるしかないし

2. 一気に欄を埋める

  • 埋まらないようだと現在までの研究もこれからの研究計画もまだ内容的に不十分だということ?
  • 「現在までの研究」
    • 自分は年度末に出した国内学会の原稿の内容をまとめた
    • ただし、分野外の人が読んでもわかるように背景や動機をやさしく書き加える
  • 「これからの研究計画」
    • 書く
    • これも同じく、分野外の人が読んでもわかるように
  • それぞれの見出しに対して数行ずつ埋めていけば、自ずと欄が一杯になるはずです
  • 逆に言うと、わざわざ細かい点を指示しているのは「申請者全員に自由に書かせると読む側が本当に苦労するから、どこに何が書いてあるかわかるように統一したい」ということかもしれない
    • 申請書のフォーマットを計画する人の気持ちは、「 “研究計画について書いてください” じゃなくて “研究計画の目的、方法、特色……について書いてください” などと細かく指定すればみんな統一的に書いてくれるかな」という感じかもしれない……
  • 図表も同時に作りましょう、暫定的でもいいので専有されるスペースを把握しておく
  • 自分は tikz 使って「議論の流れ」とか「処理の流れ」とか、あと図が書けるテーマだった(というよりも図そのものが手法だった)のでいろいろ書きました
  • 白黒なので、強調は太字や下線を使い分ける
    • 強調は術語や新語、アピールする単語?
    • 下線は自分の主張?
    • など

3. 削る

  • 申請書の欄は狭いので、見出し埋めの途中ではみ出る
    • LaTeX の場合だと出力が紙から出てしまうので、ちゃんと書けているか確認すらできない!
    • 上から順に削っていくと、書きたいことが紙にすべて収まる頃にはまともな体裁に見えてくる
  • 削り方も難しいですが、案としては
    • 言い換える
    • 重複した表現を圧縮する
    • 余計な修飾を省く
    • そもそも踏み込みすぎた内容は避ける
    • \vspace{-0.3em} (単位はなんでもいいけど)
    • itemize の幅を小さくする
    • 参考文献のサイズを落とす
    • setstretch 的なアレは最終手段ですが自分は0.96くらいにしました

4. 取捨選択をする

  • 前項と並行する話です
  • 何を書くべきか、という話についてです
    • 自分とぜんぜん違う分野の人が審査するかもしれない
    • 指導教員ですら「その提案内容は既存研究とどう違うの?」と訊いてしまうような内容が、分野外の人に理解してもらえるとは到底思えない
    • 「なるべく易しく書くべき」であるのは間違いない
    • しかし、易しく書きすぎて「本当にこいつわかってるのか? 教科書の内容そのまま書いただけじゃないか?」と訝しまれてはアウト
    • どうしよう……という話になります
    • わからん
    • 「自分のわかっている感をアピールするために踏み込んだことを書く」と「審査する人にわかってもらえるように易しく書く」のバランスを頑張るしかない、という結論にしかなりません
    • https://en.wikipedia.org/wiki/Goldilocks_principle
  • 踏み込んで書けない(書いても理解してもらえなさそう)な話は、「こういうものだと言い張るしかないんです、すみませんが受け入れてください」的な雰囲気で押し切るしかない
    • その話が最終的にどういうメリットをもたらすか、についてはしっかり書きましょう
  • たぶんこの点は科研費の申請書とやらを書く頃になっても悩む
    • 今のうちはあまり気にしすぎないほうが(精神に)いいと思います

5. 見てもらう

  • 指導教員、研究室の人、隣の研究室の教員、友人、etc.
  • おすすめは「他分野の専門家で、かつ国語が得意な人」に見てもらうことです
    • 同じ分野の人だと「内容について事前知識があるから文が下手でも議論の全体像がわかってしまう」ということが往々にしてあります、特に指導教員とか
    • DC通してる他分野の先輩がいるなら一番良いはずです
  • 「読めない! つまり何が言いたいの?」「ここはこういうことなんです!」「じゃあその通りに書いてくれ!」「たしかに」などという問答が繰り返されます
    • 国語が得意だと通りの良いクリアな文の案を出してくれる
    • 「要点は段落の頭に」「なるべく文は短く」とか、英語論文の書き方に近い姿勢です
  • 「これなに? 結論しか書いてないけど」「そこはそういうものなんだと諦めてください、議論としてはわかりますか?」「まあなんとか」という会話もあるかもしれないです
  • 頭のなかに好きなキャラクターなどがいるとかなり強いです(自分はいないけど)
    • 脳内読み上げ&解説をする

6. 提出する

  • 評価書の依頼は早めにしておきましょう
    • 早めに申請書を完成させて渡しておくと指導教員のモチベーションも出やすい、という意見をどこかで見た
  • 「はぁ終わった〜」と久々にビールを飲む
    • これは嘘で、TokyoCLの懇親会で飲んでいたことが発覚

おまけ

雑感

  • 下手なことを言いますが、大学院生なんて指導教員の助けがないと論文も満足に書けないわけです
    • 私は「自分は国語が得意な方」だとずっと思ってたんですけど(嘘ですけど)、院に入って鼻を折られたんです
  • 研究内容が難しくても、言葉選びや論理展開がまともならそれだけで好印象だと思います
    • 図も入れてね
  • 指導教員の指導のもと押し切った業績で採用されても、たぶんその後で生き残れないと思うし
  • ちゃんと書きましょう、時間をかけて内容を練りましょう、研究者をやるなら今後ずっと必要になるスキルです
  • 業績は知らないです、ちなみに私は業績がないです
  • 自己評価は「こんなの素面じゃ書けないよねww」と笑われるくらいの勢いで書きました
    • 素面で書いたんよ (´・ω・`)
    • のちにお酒を飲みながら自分で読んでみて笑いました
  • 採用されてるといいなぁ

私の時系列

  • 2016年4月上旬
    • そろそろ学振のこと考えないとな〜
    • サイトから申請書(白紙)をダウンロードして、何を書けばいいか把握する
    • 身近にいる先輩に正例を頂き、眺める
    • 「先輩ここ誤字ってません?」「まあそれで通るということだね」
  • 2016年4月下旬
    • (4月末と5月1週目の終わりに論文の投稿機会があった)
    • 英語の論文って書くのほんとに大変だなと苦しむ
  • 2016年5月1週末
    • 論文の投稿をする
  • 2016年5月2週目
    • 申請書を書き始める
    • おおよそまるまる1週間くらいで書きました
      • わりと切羽詰まりながら書いて、計50時間くらいでしょうか
    • 内部の締め切りは16日でした
    • 3月に書いた日本語の原稿に「現在までの研究」が丁寧にまとまっていたので、その分の負担は小さかった
    • 書く内容を列挙した時点で人に見てもらったり、いろいろ並行しました
    • できれば2週間は欲しかったな、という感想(同専攻で採用された先輩はゆっくり一ヶ月かけたそうです)
おわり