[R] Rでテキストマインニング (英語編)

Rを使って、英語で書かれたテキストを分析する準備。便利なリンク先とメモ:

  1. OsakaR_7: Rでテキストマイニングをする前に
    1. Package ‘tm’ [pdf]
    2. Stemming (Wikipedia)
    3. Lemmatisation (Wikipedia)
  2. TreeTagger- a language independent part-of-speech tagger
    1. TreeTaggerを使った英語の形態素解析 (よしなしごと)
    2. Mac OS X でシェル(bash)のパスを通す (chichirou技術メモ)
    3. TreeTagger [投野先生の授業ページwiki; Windowsでインストールから実行まで]
    4. Tree Tagger の連続実行 [投野先生の授業ページwiki]
      1. [メモ]"cmd/tree-tagger-english-utf8" は長いので、"tree-tagger-english-utf8"を"tteng"と名称変更した。→ ターミナルで "tteng ファイル名" で品詞と原形を表示してくれる。
*****

#tmパッケージをインストールする:
> install.packages("tm", dependencies=TRUE)

#tmパッケージを読み込む:
> library(tm)

0 件のコメント:

コメントを投稿

[Windows] AutoHotKey その2

職場の Windows PC に AutoHotKey というソフトを導入して、キーバインドを変更 したら、ものすごくキー入力が楽になった。ホームポジションから手をはずさずに上下左右、行頭・行末にカーソルを移動させたり、文字を削除したりできる。ストレスフリー。 カーソル移動系...