Google Colabで知られていないが有用な機能7選:Google Colaboratory入門
Colabをもっと便利に活用するためのTips(インタラクティブ・テーブル、実行履歴、コードによるファイル表示、絵文字&LaTex文字の入力サポート、コマンドパレット、GitHub用リンク付きバッジ生成、Colab新バージョンのリリースノート閲覧など)を紹介する。
本稿ではGoogle Colaboratory(以下、Colab)に搭載されている機能の中で、あまり知られていないと思われるものを厳選して、スクリーンキャプチャ中心で紹介する。以前に「Google ColabユーザーのためのTipsトップ10」という記事を公開しているが、本稿はその第2弾という位置付けになる。
※本稿を執筆するに当たって、公式YouTube動画「Google Colab features you may have missed(見逃しがちなGoogle Colabの機能)」と公式Twitterアカウント「@GoogleColab」の内容を参考にした。
1. インタラクティブ・テーブル(Interactive Table)による表データ探索
Pythonデータ分析ライブラリー「pandas」のデータフレーム(DataFrame)を使って表データを扱う場合、ColabやJupyterではpandasの表データをきれいに表示できる。ところで、Colabではより高度にデータ探索を行うための機能としてInteractive Table(インタラクティブ・テーブル)も用意されているのをご存じだろうか。
この機能を使うには、通常通りにpandasのデータフレームを出力すればよい。例えばリスト1は、空港データのデータフレームを取得して出力しているコードである。
from vega_datasets import data
df = data.airports()
df
すると、表データの右上に[Convert this dataframe to an interactive table.(このデータフレームをインタラクティブ・テーブルに変換)]というアイコンが出るのでこれをクリックするだけである(図2)。
これにより、前掲の図1のように出力され、列の並び替えや、キーワードによるフィルタリング、ページネーション、CSV/JSON/Markdown形式で表データのコピーなどが行える。
2. コードの実行履歴(Execution History)
Colabのメニューバーから[表示]−[コードの実行履歴]を実行すると、右ペインの[実行数]にこれまでに実行してきたコードとその結果が一覧表示される。なお、ランタイムを再起動すると、履歴はクリアされる。
「少し前に実行したコードを修正してしまったけど、どんなコードと結果だったかな?」と思ったときに再確認するのに便利だろう。「そのコードをもうちょっと修正したら、どういう結果になるかな?」と思ったときには、各コードの左方にある[スクラッチセルにコピー]ボタンをクリックするとよい。これにより、図4のようにスクラッチセル(=その場で簡易的にコードを実行できるセル)にコピーされるので、そこでコードを少し修正して挙動の違いを検証したりできる。
3. コードによるファイル表示
Colabの左ペインの[ファイル]タブで目的のファイルをダブルクリックすると開いて表示することができる。そうではなく、「コードによる何らかの処理結果などで自動生成したファイルを自動的に開きたい」というニーズもあるのではないだろうか。これも可能である。具体的には、リスト2のようなコードをコードセルに書くだけである。
from google.colab import files
files.view('/content/sample_data/README.md')
4. 絵文字やLaTeX文字の入力サポート
Colabのテキストセルでは、「:」で絵文字が、「\」でLaTeX文字(本稿ではLaTeXコマンドで指定した数学記号などの特殊文字を指す)が簡単に入力できるようになっている。機械学習では数学を使うことがよくあるので、数式以外の地の文でも数学記号を使いたい場面がよくある。そんなときにLaTeX文字の入力サポートは役立つ。
なお、上記の説明は通常のMarkdownテキストの中に「文字」を挿入する場合の話である。別の方法として、$$〜$$(ブロックで記述)や$〜$(インラインで記述)によるLaTeXの「数式」を書くこともでき、この場合も図5と同じように入力候補のリストが表示される。
5. コマンドパレット(Command Palette)
Copyright© Digital Advantage Corp. All Rights Reserved.