ホーム > 正規表現とテキスト・マイニング
正規表現とテキスト・マイニング
本体2,800円+税
ISBN 9784750318004
判型・ページ数 A5・312ページ
出版年月日 2003/10/01

正規表現とテキスト・マイニング

情報発見のツール・キット

カオス化するインターネット情報の中から、重要な学術資源や技術情報を発見するための手法を紹介。情報の検索・収集から、その処理・活用や文書情報の要約、そして新情報の発見や知識の構築まで、情報技術を活用して実現できる実践的な方法論を図解する。
1 情報の収集と検索
 1-1 パソコンに図書館が収まる時代が来た
 1-2 インターネットの情報水脈
 1-3 サイトの情報を全部取り込もう
 1-4 インターネットから百科事典を集めよう
 1-5 自前で作るデータベース
 1-6 電子情報倉庫は整理無用
 1-7 縮小印刷で高密度情報ファイルを作成
 1-8 パーソナル・データベースの構築

2 情報発見の技術
 2-1 「情報」と「電子情報」との違い
 2-2 文字列パターン発見の技術「正規表現」
 2-3 正規表現の記述法の改善
 2-4 正規表現を組み込んだサーチエンジン
 2-5 正規表現とテキスト・マイニング

3 秀丸エディタで正規表現を使う
 3-1 秀丸の正規表現(メタキャラクタ)
 3-2 grep検索
 3-3 OR検索
 3-4 AND検索
 3-5 タグジャンプ
 3-6 高度な検索例――判断情報の発見
 3-7 正規表現を使ったテキスト処理

4 MS WORDを活用したテキスト・マイニング
 4-1 テキスト・マイニングとワード・プロミナンス
 4-2 MS WORDのワイルド・カード
 4-3 キーワードをビジュアルに表示する
 4-4 キーワードを取り出す
 4-5 キーワード一覧を自動的に作成する
 4-6 キーワード頻度表を作る(Excel)
 4-7 テキスト・マイニングの事例――米国特許分析での活用
 4-8 文書処理の効率化

5 KWIC検索
 5-1 KWICとは
 5-2 KWICソフト
 5-3 KWIC検索の事例

6 「KWIC検索+正規表現」でテキスト・マイニング
 6-1 KWIC検索に正規表現を使う
 6-2 検索結果をクラスタリング分類にかける

7 プロセス知と情報技術
 7-1 プロセス情報を集積する
 7-2 プロセス知の源泉を作る

追補
1 述語論理
2 正規表現と有限状態オートマトン

同じジャンルの本

このページのトップへ