Submit Search
Upload
Pydata tokyo-24-hootku
•
Download as PPTX, PDF
•
0 likes
•
139 views
Yasunori Horikoshi
Follow
PyData.tokyo #24 のLTの資料です
Read less
Read more
Data & Analytics
Report
Share
Report
Share
1 of 13
Download now
Recommended
Pentaho CTools 20140902
Pentaho CTools 20140902
Teruo Kawasaki
Rsj2013 sekiyama 2
Rsj2013 sekiyama 2
openrtm
Rsj2013 sekiyama 3
Rsj2013 sekiyama 3
openrtm
Python × Herokuで作る 雑談slack bot
Python × Herokuで作る 雑談slack bot
dcubeio
GoでシュッとWebスクレイピングする
GoでシュッとWebスクレイピングする
Yuta Ohashi
Metahub for github
Metahub for github
Suguru Oho
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
Katsuhiro Morishita
鳥取python勉強会 第1回
鳥取python勉強会 第1回
Yuji Oyamada
Recommended
Pentaho CTools 20140902
Pentaho CTools 20140902
Teruo Kawasaki
Rsj2013 sekiyama 2
Rsj2013 sekiyama 2
openrtm
Rsj2013 sekiyama 3
Rsj2013 sekiyama 3
openrtm
Python × Herokuで作る 雑談slack bot
Python × Herokuで作る 雑談slack bot
dcubeio
GoでシュッとWebスクレイピングする
GoでシュッとWebスクレイピングする
Yuta Ohashi
Metahub for github
Metahub for github
Suguru Oho
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
Katsuhiro Morishita
鳥取python勉強会 第1回
鳥取python勉強会 第1回
Yuji Oyamada
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
(shibao)芝尾 (kouichiro)幸一郎
オープンソースのETLツール Pentaho Data Integration(PDI)のご紹介_20140906
オープンソースのETLツール Pentaho Data Integration(PDI)のご紹介_20140906
Teruo Kawasaki
再考: お買い得物件を機械学習で見つける方法
再考: お買い得物件を機械学習で見つける方法
智志 片桐
HealthKitで日別のデータを一度に取得する
HealthKitで日別のデータを一度に取得する
今城 善矩
20190723 mlp lt_bayes_pub
20190723 mlp lt_bayes_pub
Yoichi Tokita
GitHub最新情報キャッチアップ 2023年6月
GitHub最新情報キャッチアップ 2023年6月
Kazumi IWANAGA
Get started with future C# .Net development with Docker
Get started with future C# .Net development with Docker
Oshitari_kochi
Yapc2012資料
Yapc2012資料
matsuo kenji
今時のオンプレなgithubクローン環境構築
今時のオンプレなgithubクローン環境構築
You&I
今日から始めるGithub
今日から始めるGithub
lion-man
Kaggle の Titanic チュートリアルに挑戦した話
Kaggle の Titanic チュートリアルに挑戦した話
y-uti
Github of project
Github of project
Ito Kunihiko
Django で始める PyCharm 入門
Django で始める PyCharm 入門
kashew_nuts
Python と Xpath で ウェブからデータをあつめる
Python と Xpath で ウェブからデータをあつめる
Shuhei Iitsuka
やさしいGitの内部構造 - yapcasia2013
やさしいGitの内部構造 - yapcasia2013
DQNEO
Redash pythonで業務分析
Redash pythonで業務分析
創史 花村
医療データ解析者へ向けた Git・GitHub 入門
医療データ解析者へ向けた Git・GitHub 入門
Yui Tomo
Pythonとgit hubとベンチャー企業の上手な付き合い方
Pythonとgit hubとベンチャー企業の上手な付き合い方
Takahiro Fujiwara
201806 hugo で静的サイト作ってみた
201806 hugo で静的サイト作ってみた
junichim
ソース管理しようぜ!Gitの部
ソース管理しようぜ!Gitの部
pmw1415
More Related Content
Similar to Pydata tokyo-24-hootku
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
(shibao)芝尾 (kouichiro)幸一郎
オープンソースのETLツール Pentaho Data Integration(PDI)のご紹介_20140906
オープンソースのETLツール Pentaho Data Integration(PDI)のご紹介_20140906
Teruo Kawasaki
再考: お買い得物件を機械学習で見つける方法
再考: お買い得物件を機械学習で見つける方法
智志 片桐
HealthKitで日別のデータを一度に取得する
HealthKitで日別のデータを一度に取得する
今城 善矩
20190723 mlp lt_bayes_pub
20190723 mlp lt_bayes_pub
Yoichi Tokita
GitHub最新情報キャッチアップ 2023年6月
GitHub最新情報キャッチアップ 2023年6月
Kazumi IWANAGA
Get started with future C# .Net development with Docker
Get started with future C# .Net development with Docker
Oshitari_kochi
Yapc2012資料
Yapc2012資料
matsuo kenji
今時のオンプレなgithubクローン環境構築
今時のオンプレなgithubクローン環境構築
You&I
今日から始めるGithub
今日から始めるGithub
lion-man
Kaggle の Titanic チュートリアルに挑戦した話
Kaggle の Titanic チュートリアルに挑戦した話
y-uti
Github of project
Github of project
Ito Kunihiko
Django で始める PyCharm 入門
Django で始める PyCharm 入門
kashew_nuts
Python と Xpath で ウェブからデータをあつめる
Python と Xpath で ウェブからデータをあつめる
Shuhei Iitsuka
やさしいGitの内部構造 - yapcasia2013
やさしいGitの内部構造 - yapcasia2013
DQNEO
Redash pythonで業務分析
Redash pythonで業務分析
創史 花村
医療データ解析者へ向けた Git・GitHub 入門
医療データ解析者へ向けた Git・GitHub 入門
Yui Tomo
Pythonとgit hubとベンチャー企業の上手な付き合い方
Pythonとgit hubとベンチャー企業の上手な付き合い方
Takahiro Fujiwara
201806 hugo で静的サイト作ってみた
201806 hugo で静的サイト作ってみた
junichim
ソース管理しようぜ!Gitの部
ソース管理しようぜ!Gitの部
pmw1415
Similar to Pydata tokyo-24-hootku
(20)
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
オープンソースのETLツール Pentaho Data Integration(PDI)のご紹介_20140906
オープンソースのETLツール Pentaho Data Integration(PDI)のご紹介_20140906
再考: お買い得物件を機械学習で見つける方法
再考: お買い得物件を機械学習で見つける方法
HealthKitで日別のデータを一度に取得する
HealthKitで日別のデータを一度に取得する
20190723 mlp lt_bayes_pub
20190723 mlp lt_bayes_pub
GitHub最新情報キャッチアップ 2023年6月
GitHub最新情報キャッチアップ 2023年6月
Get started with future C# .Net development with Docker
Get started with future C# .Net development with Docker
Yapc2012資料
Yapc2012資料
今時のオンプレなgithubクローン環境構築
今時のオンプレなgithubクローン環境構築
今日から始めるGithub
今日から始めるGithub
Kaggle の Titanic チュートリアルに挑戦した話
Kaggle の Titanic チュートリアルに挑戦した話
Github of project
Github of project
Django で始める PyCharm 入門
Django で始める PyCharm 入門
Python と Xpath で ウェブからデータをあつめる
Python と Xpath で ウェブからデータをあつめる
やさしいGitの内部構造 - yapcasia2013
やさしいGitの内部構造 - yapcasia2013
Redash pythonで業務分析
Redash pythonで業務分析
医療データ解析者へ向けた Git・GitHub 入門
医療データ解析者へ向けた Git・GitHub 入門
Pythonとgit hubとベンチャー企業の上手な付き合い方
Pythonとgit hubとベンチャー企業の上手な付き合い方
201806 hugo で静的サイト作ってみた
201806 hugo で静的サイト作ってみた
ソース管理しようぜ!Gitの部
ソース管理しようぜ!Gitの部
Pydata tokyo-24-hootku
1.
BigQueryに保存するとき カラム名と型をチェックしてくれる ライブラリを作ってみました 2021-11-26 PyData Tokyo meetup
#24 堀越保徳 a.k.a. @hotoku
2.
自己紹介 • 堀越保徳 • @hotoku
ほとんど休眠 • 株式会社JDSC 勤務 • 本発表の内容は個人の見解であって、所属組織を代表するものではあ りません(お約束)
3.
サマリ • Python→BigQueryにデータを保存するときに、ちょっと便利 なパッケージを造りました(ニッチですね🚢) • https://github.com/hotoku/bqsc •
https://pypi.org/project/bqsc/ • 最適化には関係ないです🙇 • 「Python×データ活用の技術的な話題」ではあるのでご容赦
4.
モチベーション データフレームにデータを詰めて、 to_gbqで、BQテーブルに保存しようとしたら・・
5.
モチベーション エラーになったのだが、どこが間違っているのか分からん・・・ • どの列が間違っているのかがエラーメッセージから分からない • 保存時に例外が投げられるので、コード上の間違っている行が分からない InvalidSchema:
Please verify that the structure and data types in the DataFrame match the schema of the destination table.
6.
モチベーション _人人人人人人人_ > preidction <  ̄Y^Y^Y^Y^Y^Y^ ̄ 実際は列がもっと 沢山あるし、ソースも 複数ファイルに亘る・・
7.
ソリューション BQのスキーマが予め分かっているなら、 チェックできるじゃないか
8.
ソリューション bqsc.load BQのスキーマ指定ファイルから、 列名と型の情報を持ったクラスを自動で定義
9.
ソリューション エラーメッセージで、 何がおかしいのか分かる 保存時ではなく、タイポしている場所 で例外を投げるので、コードの場所が 分かる
10.
ソリューション 型の間違いも検出してくれる
11.
ソリューション 型定義を生成するCLIがアリ〼 🐜 ※CLIの詳しい使い方は、 レポジトリのサンプル 参照
12.
ソリューション 型情報を使えば、エディタが自動で補完してくれたり、 型の間違いを、リアルタイムで教えてくれるようになり〼
13.
サマリ • Python→BigQueryにデータを保存するときに、ちょっと便利 なパッケージを造りました • メタプログラミングを使ってみたかった •
ご清聴ありがとうございました 🐜
Download now