正規表現技術入門 ―最新エンジン実装と理論的背景(技術評論社) [電子書籍]
    • 正規表現技術入門 ―最新エンジン実装と理論的背景(技術評論社) [電子書籍]

    • ¥3,630726 ゴールドポイント(20%還元)
    • すぐ読めます
100000086600742962

正規表現技術入門 ―最新エンジン実装と理論的背景(技術評論社) [電子書籍]

価格:¥3,630(税込)
ゴールドポイント:726 ゴールドポイント(20%還元)(¥726相当)
フォーマット:
専用電子書籍リーダアプリ「Doly」が必要です。無料ダウンロード
出版社:技術評論社
公開日: 2018年11月14日
すぐ読めます。
お取り扱い: のお取り扱い商品です。
ご確認事項:電子書籍リーダーアプリ「Doly」専用コンテンツ
こちらの商品は電子書籍版です

正規表現技術入門 ―最新エンジン実装と理論的背景(技術評論社) の 商品概要

  • 最先端の正規表現技術にスポットを当てた,初学者向け技術解説書。プログラマにとって欠かせないツールである正規表現。便利な正規表現の実力を発揮させるには,動作原理から理解するのが近道です。
    本書では,パターンマッチの基本から,基本三演算および理論/数学的背景,VM型/DFA型という二大最新エンジン実装まで徹底解説。また,処理系を踏まえた効率的な書き方や落とし穴を避ける技法もしっかり押さえます。狙いどおりのパターンを綴り,高速に文字列を取得したい,そんなエンジニアの方々へ,長く役立つ技術知識を満載してお届けします。
  • 目次

    第1章 [入門]正規表現 --メタ文字,構文,エンジン
    1.1 正規表現の基本
    正規表現とは何か
    パターンとマッチ
    書き方はいろいろ
    基本的な正規表現のメタ文字と構文
    正規表現エンジン
    1.2 文字列と文字列処理
    Column 「正規」とは?
    コンピュータと文字列
    文字列は扱いやすい
    プログラミングで
    プログラムの実行で
    設定ファイルの書き換えで
    ログの検索や整形で
    Twitterで
    1.3 正規表現の基本三演算 --連接,選択,繰り返し
    3つの基本演算とは?
    パターンの連接
    パターンの選択
    連接と選択の組み合わせ
    パターンの繰り返し
    Column 「任意の〜」
    長さに制限のないパターン
    Column きちんとした文法の定義 --BNF
    基本三演算の組み合わせ
    基本三演算を1種類しか使えない場合
    基本三演算を2種類しか使えない(1) --「連接/選択だけしか使えない」場合
    基本三演算を2種類しか使えない(2) --「選択と繰り返しだけしか使えない」場合
    基本三演算を2種類しか使えない(3) --「連接と繰り返しだけしか使えない」場合
    演算を制限した場合に表現できるパターン
    演算子の結合順位
    丸括弧によるグループ化
    1.4 正規表現のシンタックスシュガー
    より便利な構文を求めて
    量指定子
    プラス演算 + --1回以上の任意回の繰り返し
    疑問符演算 ? --0回か1回,あるかないか?
    範囲量指定子 {n,m} --n回からm回の繰り返し
    範囲量指定子の万能性
    ドット . --任意の1文字
    文字クラス
    範囲指定
    否定
    エスケープシーケンス
    メタ文字をエスケープする
    アンカー
    Column 長さがゼロの文字列?
    1.5 キャプチャと置換 --正規表現で文字列を操作する
    文字列の部位 --接頭辞,接尾辞,部分文字列
    マッチングの種類
    部分一致か,完全一致か
    アンカーとマッチングの種類
    サブパターンとサブマッチ
    キャプチャ
    順番で指定
    名前で指定 --名前付きキャプチャ
    grepでのキャプチャ
    キャプチャしないグループ化
    サブマッチの優先順位
    Column よく使う構文ほど簡潔に --Huffman符号化の原則
    優先順位の高さは左から右
    欲張り量指定子と控え目な量指定子
    欲張りな量指定子と控え目な量指定子の挙動の違い
    控え目な量指定子の活用例
    サブマッチの優先順位を理解する
    正規表現による文字列の置換
    文字列置換のツール
    sed
    Perlのワンライナー実行
    There's More Than One Way To Do It
    1.6 正規表現の拡張機能 --先読み/再帰/後方参照
    先読み
    否定先読み
    否定先読みで正規表現の「否定」を書く
    後読みと否定後読み
    先読み/後読みの便利さ
    先読みで正規表現の「積」(AND)を書く
    再帰
    再帰的なパターン
    再帰を使わないと書けないパターン
    後方参照
    基本三演算では表現できないパターン
    強力さと読みやすさ
    1.7 正規表現エンジンの基本
    正規表現エンジンの種類 --DFA型とVM型
    DFA型のキーワード --決定性と非決定性
    有限オートマトンで正規表現の理解を深める
    VM型のキーワード --バックトラック
    次章からの流れ
    Column NFA? VM? バックトラック?
    Column プログラミングと正規表現
    第2章 正規表現の歴史 --理論と実装の両面から
    2.1 正規表現の起源 --「計算」に関する定式化
    チューリングマシンとアルゴリズム
    脳の計算モデルと形式的ニューロン
    2.2 Kleeneによる統一
    記憶領域の有無 --形式的ニューロンとチューリングマシンの決定的な違い
    正規表現の誕生
    有限オートマトンの導入
    Column 正規(regular)って何?
    オートマトン理論の発展
    2.3 [実装編]プログラマの相棒へ
    最初の正規表現エンジン
    QED --正規表現による検索ができるテキストエディタの登場
    edエディタからgrepへ
    Unixと正規表現
    2.4 プログラミング言語と正規表現の出会い
    汎用プログラミング言語への進出 --AWK
    POSIXによる標準化
    Henry Spencerの正規表現ライブラリ
    2.5 現代の正規表現エンジン事情
    GNU grep
    Google RE2
    Perl
    PCRE
    Column 後方参照の起源
    JavaScript
    Ruby
    第3章 プログラマのための一歩進んだ正規表現 --純粋な正規表現と,最新エンジン実装の比較

    第4章 DFA型エンジン --有限オートマトンと決定性

    第5章 VM型エンジン --鍵を握るのは「バックトラック」

    第6章 正規表現エンジンの三大技術動向 --JITコンパイル,固定文字列探索,ビットパラレル

    第7章 正規表現の落とし穴 --バックトラック増加,マッチ,振る舞いの違い

    第8章 正規表現を超えて --「書かない」「読み解く」「不向きな問題を知る」

    Appendix

正規表現技術入門 ―最新エンジン実装と理論的背景(技術評論社) の商品スペック

シリーズ名 WEB+DB PRESS plus
書店分類コード K800
Cコード 3055
出版社名 技術評論社
本文検索
他の技術評論社の電子書籍を探す
紙の本のISBN-13 9784774172705
ファイルサイズ 18.8MB
著者名 新屋良磨
鈴木勇介
高田謙
喜田拓也
浦本武雄
著述名

    技術評論社 正規表現技術入門 ―最新エンジン実装と理論的背景(技術評論社) [電子書籍] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!