高速文字列解析の世界―データ圧縮・全文検索・テキストマイニング(シリーズ確率と情報の科学) [全集叢書]

販売休止中です

    • 高速文字列解析の世界―データ圧縮・全文検索・テキストマイニング(シリーズ確率と情報の科学) [全集叢書]

    • ¥3,30099 ゴールドポイント(3%還元)
100000009001715706

高速文字列解析の世界―データ圧縮・全文検索・テキストマイニング(シリーズ確率と情報の科学) [全集叢書]

価格:¥3,300(税込)
ゴールドポイント:99 ゴールドポイント(3%還元)(¥99相当)
日本全国配達料金無料
出版社:岩波書店
販売開始日: 2012/12/26
お取り扱い: のお取り扱い商品です。
ご確認事項:返品不可

高速文字列解析の世界―データ圧縮・全文検索・テキストマイニング(シリーズ確率と情報の科学) の 商品概要

  • 要旨(「BOOK」データベースより)

    文書、ウェブページ、ゲノム配列、センサデータ、行動履歴など、多様な情報が「文字列」として表現される。そのデータ量は近年、爆発的に増加しており、多くの分野で、より高度で高速な解析技術が求められている。本書では文字列解析に有用な理論、データ構造、アルゴリズムと、それをふまえたデータの圧縮、検索、分析の実践手法を紹介する。
  • 目次

    まえがき
    第1章 文字列解析の今
    1.1 世の中の文字列
    1.2 現在の計算機環境
    1.3 文字列解析の例
    1.4 文字列解析のための道具
    1.5 本書の概要
    第2章 文字列解析の準備
    2.1 文字列の記法
    2.2 文字列上の操作
    2.3 経験エントロピー
    2.4 計算モデル
    2.5 符号
    第3章 Burrows Wheeler変換
    3.1 接尾辞配列
    3.2 Burrows Wheeler変換
    3.3 接尾辞配列,BWTの構築
    3.4 BWTの性質と復元
    第4章 簡潔データ構造
    4.1 圧縮と索引の融合
    4.2 完備辞書
    4.3 木に対する簡潔データ構造
    第5章 ウェーブレット木
    5.1 文字列上の操作の実現
    5.2 ウェーブレット木の構築方法と特徴
    5.3 文字列操作の実現
    5.4 さまざまなデータへの適用
    5.5 ウェーブレット木の圧縮
    5.6 アルファベット数が大きい場合
    第6章 文字列データ圧縮
    6.1 基本的なデータ圧縮の例
    6.2 辞書を用いた圧縮:LZ法
    6.3 文脈を利用した圧縮:PPM法
    6.4 BWTを利用した圧縮
    6.5 透過的データ圧縮
    第7章 全文検索
    7.1 問題設定
    7.2 逐次検索
    7.3 全文索引
    7.4 接尾辞配列による検索
    7.5 圧縮全文索引
    7.6 キーワード集合の管理
    7.7 アルファベットサンプリング
    第8章 テキストマイニングのためのデータ構造
    8.1 接尾辞木と極大部分文字列
    8.2 文書集合の統計量
    8.3 文書配列を利用した統計量の計算

    参考文献
    索 引
  • 著者紹介(「BOOK著者紹介情報」より)(本データはこの書籍が刊行された当時に掲載されていたものです)

    岡野原 大輔(オカノハラ ダイスケ)
    1982年生まれ。2010年3月、東京大学大学院情報理工学系研究科コンピュータ科学専攻博士課程を修了、情報理工学博士。2006年3月に(株)Preferred Infrastructureを共同で創業、現在、同社取締役副社長。主な受賞歴は、IPA未踏ソフトウェア創造事業スーパークリエータ認定(2005年)、東京大学総長賞(2007年)、言語処理学会年次大会優秀発表賞(2009年、2010年)など
  • 著者について

    岡野原 大輔 (オカノハラ ダイスケ)
    岡野原大輔(おかのはら だいすけ)
    1982年生まれ.2010年3月,東京大学大学院情報理工学系研究科コンピュータ科学専攻博士課程を修了,情報理工学博士.2006年3月に(株)Preferred Infrastructureを共同で創業,現在,同取締役副社長.主な受賞歴は,IPA未踏ソフト創造事業スーパークリエータ認定(2005年),東京大学総長賞(2007年),言語処理学会年次大会優秀発表賞(2009年,2010年)など.

高速文字列解析の世界―データ圧縮・全文検索・テキストマイニング(シリーズ確率と情報の科学) の商品スペック

商品仕様
出版社名:岩波書店
著者名:岡野原 大輔(著)
発行年月日:2012/12/26
ISBN-10:4000069748
ISBN-13:9784000069748
判型:A5
対象:専門
発行形態:全集叢書
内容:数学
言語:日本語
ページ数:140ページ
縦:22cm
他の岩波書店の書籍を探す

    岩波書店 高速文字列解析の世界―データ圧縮・全文検索・テキストマイニング(シリーズ確率と情報の科学) [全集叢書] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!