BigQueryでSQLの環境構築をしてみた件
SQL初心者がSQLの環境構築の四苦八苦しながら、BigQueryをかろうじて使えるようになったのでシェアします。
BigQueryは、Googleが提供するクラウド型のSQLサービスです。
これがBigQueryの最初の画面です。
すでにGoogle Cloud Platform(GCP)登録済みの場合は右上のコンソールをクリック、
登録していない場合は右上の無料で開始をクリックして、登録をしましょう。
なお、ブログを書いている時点では、登録しても12か月間、300ドル分の無料枠が使えます。
なお、登録の流れなどは次のページを参考ください。
まず、プロジェクト作成のため、画面上の青いバーのGoogle Cloud Platformの横の部分をクリックします。
新しいプロジェクトを作成する場合は、右上の新しいプロジェクトをクリック。
もちろん、既存のプロジェクトがある場合はそちらを使ってもかまいません。
適当にプロジェクト名を入力して作成をクリック。
プロジェクトを作成したら、次はデータセットを作成します。
画面右下のデータセットを作成、をクリック。
データセットIDに適当な名称を入れてデータセット作成をクリック。
なお、GitHubでSQLのサンプルデータをみつけましたので、ご参考までに。
1つしかないので、複数テーブルの結合を練習したい場合は、自分で作成する必要があります。
画面左下のデータセット(今回はSQL)を選択すると、テーブルを作成が表示されるので、クリック。
csvを取り込む場合は、テーブルの作成元をクリックしてcsvを選択。
テーブル名はデータの内容にあうそれっぽいものを入力しましょう。
スキーマは、データを取り込むと、自動検出のチェックボックスが出てきます。
こちらにチェックを入れると、データ内の一番上の行の文字をカラム名として取り込みます。
取り込むとこんな感じに。
やや画面が狭いのが気になります。
クエリエディタ内にSQLのコマンドを入力し、実行するとDBを取得できます。
テーブルの中身は、画面下のプレビューを押せば確認することが可能です。
なお、BigQueryの仕様上、FROMでテーブルを取り込む際は、テーブル名を
``(グレイヴ・アクセント)で囲み、
`プロジェクトID.(ドット)データセット名.(ドット)テーブル名`
とする必要がありますので気を付け下さい。
以上になります、最後までお読みいただきありがとうございました。