Rを使って、英語で書かれたテキストを分析する準備。便利なリンク先とメモ:
- OsakaR_7: Rでテキストマイニングをする前に
- Package ‘tm’ [pdf]
- Stemming (Wikipedia)
- Lemmatisation (Wikipedia)
- TreeTagger- a language independent part-of-speech tagger
- TreeTaggerを使った英語の形態素解析 (よしなしごと)
- Mac OS X でシェル(bash)のパスを通す (chichirou技術メモ)
- TreeTagger [投野先生の授業ページwiki; Windowsでインストールから実行まで]
- Tree Tagger の連続実行 [投野先生の授業ページwiki]
- [メモ]"cmd/tree-tagger-english-utf8" は長いので、"tree-tagger-english-utf8"を"tteng"と名称変更した。→ ターミナルで "tteng ファイル名" で品詞と原形を表示してくれる。
#tmパッケージをインストールする:
> install.packages("tm", dependencies=TRUE)
#tmパッケージを読み込む:
> library(tm)
0 件のコメント:
コメントを投稿