Le Chat Blanc: [R] Rでテキストマインニング (英語編)

[R] Rでテキストマインニング (英語編)

Rを使って、英語で書かれたテキストを分析する準備。便利なリンク先とメモ：

OsakaR_7: Rでテキストマイニングをする前に

Package ‘tm’ [pdf]
Stemming (Wikipedia)
Lemmatisation (Wikipedia)

TreeTagger- a language independent part-of-speech tagger

TreeTaggerを使った英語の形態素解析 (よしなしごと)
Mac OS X でシェル(bash)のパスを通す (chichirou技術メモ)
TreeTagger [投野先生の授業ページwiki; Windowsでインストールから実行まで]
Tree Tagger の連続実行 [投野先生の授業ページwiki]

[メモ]"cmd/tree-tagger-english-utf8" は長いので、"tree-tagger-english-utf8"を"tteng"と名称変更した。→ ターミナルで "tteng ファイル名" で品詞と原形を表示してくれる。

＊＊＊＊＊

#tmパッケージをインストールする：
> install.packages("tm", dependencies=TRUE)

#tmパッケージを読み込む：
> library(tm)

0 件のコメント:

コメントを投稿

登録: コメントの投稿 (Atom)