技術的貯金

鳴かぬなら 作ってしまおう ホトトギス

GCPのML Opsハンズオンに参加した

Kaz Satoさんによる講演。

下記簡易メモ

01 MLOps at Google

PoC段階で終わる例が多い。データサイエンスとエンジニアの壁。 Operatingの方がLaunchingより難しい。 精度が落ちた時に検出できるか。

  • DevOpsとMLOpsは別物。
    • DevOps: CI/CDを回す。Reproducibility大事。
    • MLOps: 振る舞いを決定するのは特徴データ。DevOpsのように単体テストで検証できない。データのガバナンスが大事。共変量シフト。機械学習のアウトプットをきちんと専門家ではない方にも説明できるか。デプロイした後で考えるは遅い!

Googleの論文。苦労の証。タイトルは「機械学習使うのは高いクレカ使うのと同じ」「機械学習使うのは技術的負債ですよ。」

うまく機械学習を回している例。ライゾマティクス社

cloud.google.com

02 AI Platform

Gaussian Processでハイパラチューンできるよ。sage makerにもありますね。

03 MLOps withAI Platform Pipelines

エンドユーザーが治して再学習できる。active learning。加工図面の自動予算見積もり。

04 AI Platform Pipelines Hands-on workshop

kubeflowのお試し。beta版なので途中で動かないものもちらほらある模様。

youtu.be

youtu.be

05 Beyond Pipelines

データの分布が時間と共に変わったかグラフなどで見れる機能( TensorFlow Model Analysis (TFMA) )できるよ。SHAP使って重要な特徴量の変化も見れるようになるよ。。

www.youtube.com

感想

MLOpsの概要について知ることができた。

ハンズオンのデモで割とトラブっていらっしゃった。やはりデモにトラブルはつきもの。それも含めてリアルで良いですね。

kubeflowやはり便利そうだ。docker-composeやaws fargateで済ませて、kubenetes避けてきたが勉強しようかしら。