本体2,800円+税
ISBN | 9784750318004 |
---|---|
判型・ページ数 | A5・312ページ |
出版年月日 | 2003/10/01 |
正規表現とテキスト・マイニング
情報発見のツール・キット
カオス化するインターネット情報の中から、重要な学術資源や技術情報を発見するための手法を紹介。情報の検索・収集から、その処理・活用や文書情報の要約、そして新情報の発見や知識の構築まで、情報技術を活用して実現できる実践的な方法論を図解する。
1 情報の収集と検索
1-1 パソコンに図書館が収まる時代が来た
1-2 インターネットの情報水脈
1-3 サイトの情報を全部取り込もう
1-4 インターネットから百科事典を集めよう
1-5 自前で作るデータベース
1-6 電子情報倉庫は整理無用
1-7 縮小印刷で高密度情報ファイルを作成
1-8 パーソナル・データベースの構築
2 情報発見の技術
2-1 「情報」と「電子情報」との違い
2-2 文字列パターン発見の技術「正規表現」
2-3 正規表現の記述法の改善
2-4 正規表現を組み込んだサーチエンジン
2-5 正規表現とテキスト・マイニング
3 秀丸エディタで正規表現を使う
3-1 秀丸の正規表現(メタキャラクタ)
3-2 grep検索
3-3 OR検索
3-4 AND検索
3-5 タグジャンプ
3-6 高度な検索例――判断情報の発見
3-7 正規表現を使ったテキスト処理
4 MS WORDを活用したテキスト・マイニング
4-1 テキスト・マイニングとワード・プロミナンス
4-2 MS WORDのワイルド・カード
4-3 キーワードをビジュアルに表示する
4-4 キーワードを取り出す
4-5 キーワード一覧を自動的に作成する
4-6 キーワード頻度表を作る(Excel)
4-7 テキスト・マイニングの事例――米国特許分析での活用
4-8 文書処理の効率化
5 KWIC検索
5-1 KWICとは
5-2 KWICソフト
5-3 KWIC検索の事例
6 「KWIC検索+正規表現」でテキスト・マイニング
6-1 KWIC検索に正規表現を使う
6-2 検索結果をクラスタリング分類にかける
7 プロセス知と情報技術
7-1 プロセス情報を集積する
7-2 プロセス知の源泉を作る
追補
1 述語論理
2 正規表現と有限状態オートマトン
1-1 パソコンに図書館が収まる時代が来た
1-2 インターネットの情報水脈
1-3 サイトの情報を全部取り込もう
1-4 インターネットから百科事典を集めよう
1-5 自前で作るデータベース
1-6 電子情報倉庫は整理無用
1-7 縮小印刷で高密度情報ファイルを作成
1-8 パーソナル・データベースの構築
2 情報発見の技術
2-1 「情報」と「電子情報」との違い
2-2 文字列パターン発見の技術「正規表現」
2-3 正規表現の記述法の改善
2-4 正規表現を組み込んだサーチエンジン
2-5 正規表現とテキスト・マイニング
3 秀丸エディタで正規表現を使う
3-1 秀丸の正規表現(メタキャラクタ)
3-2 grep検索
3-3 OR検索
3-4 AND検索
3-5 タグジャンプ
3-6 高度な検索例――判断情報の発見
3-7 正規表現を使ったテキスト処理
4 MS WORDを活用したテキスト・マイニング
4-1 テキスト・マイニングとワード・プロミナンス
4-2 MS WORDのワイルド・カード
4-3 キーワードをビジュアルに表示する
4-4 キーワードを取り出す
4-5 キーワード一覧を自動的に作成する
4-6 キーワード頻度表を作る(Excel)
4-7 テキスト・マイニングの事例――米国特許分析での活用
4-8 文書処理の効率化
5 KWIC検索
5-1 KWICとは
5-2 KWICソフト
5-3 KWIC検索の事例
6 「KWIC検索+正規表現」でテキスト・マイニング
6-1 KWIC検索に正規表現を使う
6-2 検索結果をクラスタリング分類にかける
7 プロセス知と情報技術
7-1 プロセス情報を集積する
7-2 プロセス知の源泉を作る
追補
1 述語論理
2 正規表現と有限状態オートマトン