Polarsとpandasで学ぶデータ処理アイデアレシピ55 [単行本]
    • Polarsとpandasで学ぶデータ処理アイデアレシピ55 [単行本]

    • ¥3,960119 ゴールドポイント(3%還元)
    • 在庫あり2025年7月31日木曜日までヨドバシエクストリームサービス便(無料)がお届け
Polarsとpandasで学ぶデータ処理アイデアレシピ55 [単行本]
画像にマウスを合わせると上部に表示
100000009003890854

Polarsとpandasで学ぶデータ処理アイデアレシピ55 [単行本]



ゴールドポイントカード・プラスのクレジット決済で「書籍」を購入すると合計10%ポイント還元!書籍の購入はゴールドポイントカード・プラスのクレジット決済がお得です。
通常3%ポイント還元のところ、後日付与されるクレジット決済ポイント(1%)と特典ポイント(6%)で合計10%ポイント還元!詳しくはこちら

価格:¥3,960(税込)
ゴールドポイント:119 ゴールドポイント(3%還元)(¥119相当)
フォーマット:
お届け日:在庫あり今すぐのご注文で、2025年7月31日木曜日までヨドバシエクストリームサービス便(無料)がお届けします。届け先変更]詳しくはこちら
出版社:講談社
販売開始日: 2024/10/11
お取り扱い: のお取り扱い商品です。
ご確認事項:返品不可
店舗受け取りが可能です
マルチメディアAkibaマルチメディア梅田マルチメディア博多にて24時間営業時間外でもお受け取りいただけるようになりました

Polarsとpandasで学ぶデータ処理アイデアレシピ55 の 商品概要

  • 目次

    準備1日目 pandas の概要

    準備2日目 Polars の概要

    特訓1日目 データの確認
    01 データの表示
    02 データの列名を確認
    03 データの大きさの確認
    04 各列のデータ型を確認
    05 データの概要を確認
    06 列ごとのユニークな要素数の確認
    07 列ごとのユニークな要素を確認
    08 ユニークな要素ごとに重複数のカウント
    09 特定の列に対する統計量の確認

    特訓2日目 データの操作
    10 ファイルの読み込み
    11 データフレームの特定ファイル形式への書き出し
    12 データフレームのソート
    13 データフレームの複製
    14 データフレームの作成

    特訓3日目 データの抽出
    15 データフレームから複数列を抽出
    16 データフレームから特定データ型の列抽出
    17 データフレームの特定列の除外
    18 データフレームの特定行の抽出
    19 特定条件にマッチする行の抽出
    20 複数条件にマッチする行の抽出1
    21 複数条件にマッチする行の抽出2
    22 特定列が欠損値でない行の抽出
    23 欠損値を含む行の削除
    24 値リストのどれかに合致する要素を持つ行の抽出
    25 特定の文字列を含む行の抽出
    26 指定された数だけランダムにデータをサンプリング

    特訓4日目 データの加工
    27 既存列へのデータ処理
    28 特定列をデータ処理し、データ型を変更
    29 既存列を用いて新規列を作成する
    30 条件に応じた値の代入
    31 列へのユーザー定義関数の適用
    32 データフレームの列名を一括変更
    33 データフレームの特定の列名を変更
    34 欠損値の補完
    35 NumPy 配列への変換
    36 データのビニング
    37 重複行の削除
    38 データフレームの連結
    39 データフレームの結合

    特訓5日目 データの集計
    40 列の集計結果を計算
    41 列の集計結果を新規列として追加
    42 累積和を計算
    43 複数列の集計結果を計算

    特訓6日目 時系列データの処理
    44 日時データから年と月を取得する
    45 時間軸に沿って値をシフトし、過去値の列を作る
    46 行の差分を新規の列として追加する
    47 時間に基づいた集約を行い、新規列を作成する
    48 特定の期間ごとのデータの集計

    特訓7日目 遅延評価
    49 遅延評価の基礎(Python 編)
    50 Polars の遅延評価機能lazy API
    51 クエリ最適化とStreaming API

    特訓8日目 実践パイプライン
    52 EDA
    53 前処理と特徴量エンジニアリング
    54 機械学習モデルの学習
    55 機械学習モデルの評価・推論
  • 出版社からのコメント

    大注目の高速ライブラリPolarsとpandasによるデータ処理が両方とも学べる!知っておきたいテクニックが盛りだくさん!
  • 内容紹介

    ★「この結果がほしい」が、驚くほど簡単に実現する!★

    大注目の高速ライブラリPolarsと定番ライブラリpandasによるデータ処理が両方とも学べる!
    知っておきたいテクニックが盛りだくさん!

    【サポートサイト】
    https://github.com/Johannyjm/polars-data-recipes-55

    【小野寺和樹氏(エヌビディア合同会社 シニアディープラーニングデータサイエンティスト)推薦!】
    本書は、Pythonを扱うデータサイエンティスト必携の実践書です。
    高速データ処理ツールPolarsの驚異的なパフォーマンスを活かした具体的な例を通じて、読者のデータ分析スキルを飛躍的に向上させます。
    pandasとの比較や使い分けも丁寧に解説されており、現場で役立つ55のレシピが収録されています。
    今度こそPolarsをマスターし、次世代のデータサイエンティストを目指すすべての人におすすめの一冊です。

    【河合俊典氏(エムスリー株式会社 VPoE)推薦!】
    機械学習エンジニア、データサイエンティストが扱うツールは、日々進化しています。
    本書は、その最先端ツールの1つであるPolarsについて、まるで日本語チュートリアルであるかのように解説しています。
    ドキュメントや技術ブログでは得られにくい、「いつカラムの操作をするのか」「交差検証をなぜ行うのか」などデータ分析の5W1Hを抑えながら、体系的にPolarsを学べる一冊になっているなと感じました。
    Polarsって何?という方、Polarsに対して尻込みしていたすべての方におすすめの一冊です!

    【主な内容】
    準備編
    1日目 pandasの概要
    2日目 Polarsの概要

    特訓編
    1日目 データの確認:Recipe01-09
    2日目 データの操作:Recipe10-14
    3日目 データの抽出:Recipe15-26
    4日目 データの加工:Recipe27-39
    5日目 データの集計:Recipe40-43
    6日目 時系列データの処理:Recipe44-48
    7日目 遅延評価:Recipe49-51
    8日目 実践パイプライン:Recipe52-55
  • 著者紹介(「BOOK著者紹介情報」より)(本データはこの書籍が刊行された当時に掲載されていたものです)

    冨山 吉孝(トミヤマ ヨシタカ)
    2015年に大阪大学工学部電子情報工学科を卒業後、大手通信会社にてインフラエンジニアに従事する。その傍ら機械学習技術やシステム開発に興味を持ち、社内起業プロジェクトにてAIレコーディングアプリの開発・リリースをリード、Kaggleでは2022年にKaggle Competitions Masterの称号を獲得した。イベントやコミュニティの企画や運営にも積極的に携わり、2023年日本大学文理学部北原研究室との共催で自動作曲コンテストの「AIミュージックバトル『弁財天』」を開催したほか、Polarsの日本語コミュニティ“Polars-ja”の立ち上げに関わる

    早川 裕樹(ハヤカワ ユウキ)
    ITエンジニアとしてキャリアをスタートし、Kaggleとの出会いをきっかけにデータ分析の世界に浸る。電車の中やキャンプ場など、場所を問わずKaggleをするほどのめり込み、2022年にはKaggle Competitions Masterの称号を獲得した。データ分析コンペを愛するあまり、個人でもデータ分析コンペ「yukiCup」を開催。現在は、ITコンサルティング企業にて、データ利活用案件を主に担当し顧客が抱える課題解決に向けて日々奮闘中

    齋藤 慎一朗(サイトウ シンイチロウ)
    2015年に東北大学大学院工学研究科を修了。大手日系SIerでシステムエンジニアとして数年の経験を積んだ後、データサイエンティストとしてのキャリアをスタート。機械学習技術の面白さに目覚める。電力、保険、航空など多岐にわたる業界の企業に対するデータ分析業務に従事。その後、特定のプロダクトに情熱を注ぎたいと考え、SaaS企業の研究開発職に就く。現在は、自然言語処理技術の研究開発およびプロダクトへの適用に従事。Kaggle Competitions Expert
  • 著者について

    冨山 吉孝 (トミヤマ ヨシタカ)
    冨山吉孝 @johannyjm1
    2015年に大阪大学工学部電子情報工学科を卒業後,大手通信会社にてインフラエンジニアに従事する.
    その傍ら機械学習技術やシステム開発に興味を持ち,社内起業プロジェクトにてAIレコーディングアプリの開発・リリースをリード,Kaggleでは2022年にCompetitions Masterの称号を獲得した.
    イベントやコミュニティの企画や運営にも積極的に携わり,2023年日本大学文理学部北原研究室との共催で自動作曲コンテストの「AIミュージックバトル!『弁財天』」を開催したほか,Polars の日本語コミュニティPolars-jaの立ち上げに関わる.

    早川 裕樹 (ハヤカワ ユウキ)
    早川裕樹 @yuki93753711
    ITエンジニアとしてキャリアをスタートし,Kaggleとの出会いをきっかけにデータ分析の世界に浸る.電車の中やキャンプ場など,場所を問わずKaggleをするほどのめり込み,2022年にはKaggle Competitions Masterの称号を獲得した.データ分析コンペを愛するあまり,個人でもデータ分析コンペ「yukiCup」を開催.
    現在は,ITコンサルティング企業にて、データ利活用案件を主に担当し顧客が抱える課題解決に向けて日々奮闘中.

    齋藤 慎一朗 (サイトウ シンイチロウ)
    齋藤慎一朗 @sinchir0
    2015年に東北大学大学院工学研究科を修了.大手日系SIerでシステムエンジニアとして数年の経験を積んだ後,データサイエンティストとしてのキャリアをスタート.機械学習技術の面白さに目覚める.電力,保険,航空など多岐にわたる業界の企業に対するデータ分析業務に従事.その後,特定のプロダクトに情熱を注ぎたいと考え,SaaS企業の研究開発職に就く.
    現在は,自然言語処理技術の研究開発およびプロダクトへの適用に従事.Kaggle Competitions Expert.

Polarsとpandasで学ぶデータ処理アイデアレシピ55 の商品スペック

商品仕様
出版社名:講談社
著者名:冨山 吉孝(著)/早川 裕樹(著)/齋藤 慎一朗(著)
発行年月日:2024/10/09
ISBN-10:4065369800
ISBN-13:9784065369807
判型:B5
対象:専門
発行形態:単行本
内容:情報科学
言語:日本語
ページ数:368ページ
縦:24cm
他の講談社の書籍を探す

    講談社 Polarsとpandasで学ぶデータ処理アイデアレシピ55 [単行本] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!