- [Mac] TreeTagger のインストールと設定 パスの通し方に関しての注意を書き加えました。
- [R] koRpus (TreeTagger の Rラッパー) で原形と品詞情報を得る フルパスを手打ちで入力する代わりに、set.kRp.env(TT.cmd=file.choose(), lang="en") を使うと簡単。
- Useful Tools TreeTagger を加えました。
[ブログ] 部分的に更新しました (TreeTagger関連)
[日記] GLACIEL のアイス・ケーキを食べた
神宮前の GLACIEL (グラッシェル) のアイス・ケーキ (entremets glace, アントルメグラッセ) を食べました。
アイスと生地の組み合わせが面白い食感。ほんのりと溶かすのがポイント。お持ち帰りは、無料ドライアイスを2時間分つけてくださいました。
お店で食べられる生グラスも大変濃厚で、おいしかったです。ちょっと隠れ家風なお店で、とっても素敵。
[R] koRpus (TreeTagger の Rラッパー) で原形と品詞情報を得る
TreeTagger を R で利用するためのラッパーである koRpus を使って、英語テキストの原形と品詞情報を得ます。なお、Mac (Yosemite) を使っています。
[1] TreeTagger と koRpus をダウンロード・インストールします:
[2] R を起動し、まずは下準備:
library(koRpus)
set.kRp.env(TT.cmd="/Users/[ユーザー名]/Applications/TreeTagger/cmd/tteng", lang="en")
- library(koRpus) は koRpusパッケージの呼び出し。
- set.kRp.env(TT.cmd="パス", lang="en") でtree-tagger-english-utf8 (上ではttengを利用) の場所と、分析する言語 ("en"glish) を指定。
set.kRp.env(TT.cmd=file.choose(), lang="en")とすると簡単。ファインダー (?) が立ち上がるので、cmdの下にあるtree-tagger-englishを選択。これで準備が完了です。
[3] 実際に分析をするには、分析したいファイルがある作業ディレクトリに移動してから:
taggedText(treetag("分析したいファイル名.txt"))でO.K.です。データフレームで返ってきます。
- $token がそのままの形、
- $lemma が原形、
- $wclass が品詞、 です。
- $tag の読み方は詳しく説明されています [pdf]。
参考
[日記] あけましておめでとうございます
少々おそくなりましたが、あけましておめでとうございます。
昨年から始めたこのブログは、このエントリーを含み40の記事を公開できました。初めのエントリー ([Mac] PRAM リセット) が示すように、当初は自分自身のみを想定読者としていました。が、予想以上に多くの方がこのブログにアクセスされているのを知り、インターネットの力を目の当たりにし、徐々に自分以外のインターネット利用者の方も意識しつつ記事を書くようになりました。(一番多くのアクセスは、[R] ggplo2 でヒストグラム描出入門)
今後は、モバイルデバイスへの対応を含み、わかりやすい記事を目指していきたいです。
本年も、よろしくお願いいたします。
[Car] クイック板金(2回目)
車のバンパーを擦ってしまった。。。ということで、 イエローハットのクイック板金 にお願いしていました。別の店舗に持って行っての作業ということで数日かかりましたが、無事に車が帰ってきました。結果、とても綺麗に直してもらい、非常に満足しています。板金をしたと言われても、素人目にはわか...
-
ggplot2 を使ってヒストグラムを描く。基本的な使い方のメモ。「 3. まとめ 」に一覧をリストアップしています。 1. 準備 分析する練習データは: data を利用する (乱数をつかって作成した)。データフレームに変換する (列名は score とする): dat...
-
普段は Mac を使っている人が、なんらかの制約 (例えば職場の支給PCなど) によって Windows を利用する時に困ってしまうことがいくつかある。そのうちの一つが「カーソル移動」だろう。例えば Mac では、文字を「control + a/e」で行頭/行末にカーソルを移動さ...