2021年6月25日金曜日

AWS 認定 機械学習 – 専門知識(MLS)に合格したときのまとめ

AWS認定7つ(アソシエイト3、専門4)取得してから受験しました。スコア903で合格。


機械学習の経験

  • 過去、業務で2年くらいデータエンジニア+機械学習で解析をしていた
  • CourseraのAndrewNgの講座を受講したことがある
  • Sebastian Raschkaの本(Python機械学習プログラミング)は読んだことがある
  • オライリーの斉藤ディープラーニング本(1)を読んだことがある

あまり体系立てて勉強をしたわけではないです。かなり忘れていたので基本から覚え直しました。

勉強内容

  • AWS SageMakerビルトイン機械学習サービスの使いどころ
  • 機械学習の基本的なこと、モデルのチューニング
  • データの前処理(ほとんどDASでカバー)
  • AWSのMLサービスは少しだけハンズオンで触りました(Transcribe, Lex, Pollyとか)

他の認定試験との位置づけ

AWS認定試験12冠になったのでまとめ - shimo lab2

DASのデータ収集、ELT処理などが内容かぶっているので先に受けておくと楽かもしれません。

AXSでのアレクサの考え方はLex、Pollyにつながっていますが、別に勉強していなくてもよいかも。

勉強のリソース

G検定の黒本

やさしめの内容でしたが用語の整理に良いです。

Sebastian Raschka本

コードもあってけっこう詳しくて良いです。

Andrew Ng の Coursera Machine Learning

解り易くて良いです。若干古いといえば古いですが、式やグラフを使ってoverfittingやunderfittingを理解することができて良いです。コースを全てやるならコードがMATLABなのが難点でした。講義はyoutubeにも全話あります。

例えば下記はLeaning curveについて。overfitting, bias, varianceなどの解説。

Lecture 10.6 — Advice For Applying Machine Learning | Learning Curves — [Andrew Ng] - YouTube

機械学習の個人ブログ

沢山ありますが、あまり理解の助けになりませんでした。何故それを使うのか、ということよりも理論的な解説が多い傾向があります。

AWSのドキュメント

SageMakerのドキュメントと合わせて、AWS MLのドキュメントも意外に勉強になりました(古いのでサービスは使わない)。AWSブログなども合わせて詳しい解説が沢山ありました。

以下自分のブックマークです。

回帰モデルの洞察- Amazon Machine Learning

複数モデルクラスの洞察 - Amazon Machine Learning

SageMakerのサンプルが大量にあるAWS公式Github aws/amazon-sagemaker-examples: Example notebooks that show how to apply machine learning, deep learning and reinforcement learning in Amazon SageMaker

Amazon SageMaker BlazingText: Parallelizing Word2Vec on Multiple CPUs or GPUs | AWS Machine Learning Blog

Amazon SageMaker BlazingText を使用して強化されたテキスト分類と単語ベクトル | Amazon Web Services ブログ

SageMaker トレーニングおよび推論ツールキットの使用 - Amazon SageMaker

Amazon SageMaker の自動モデルチューニングで、ランダム検索とハイパーパラメータスケーリングをサポート | Amazon Web Services ブログ

Amazon SageMaker Studio notebooks で独自のカスタムコンテナイメージを使用する | Amazon Web Services ブログ

Amazon SageMaker Object2Vec の概要 | Amazon Web Services ブログ

Amazon Elastic Inference を使用して Amazon SageMaker で PyTorch モデルの ML 推論コストを削減する | Amazon Web Services ブログ

異常検出にビルトイン Amazon SageMaker Random Cut Forest アルゴリズムを使用する | Amazon Web Services ブログ

Understanding Amazon SageMaker notebook instance networking configurations and advanced routing options | AWS Machine Learning Blog

PCAの例 Running Principal Component Analysis in Amazon SageMaker | AWS Machine Learning Blog

データアクセス制御のためのポリシーの例が豊富 Millennium Management: Secure machine learning using Amazon SageMaker | AWS Machine Learning Blog

Optimizing costs for machine learning with Amazon SageMaker | AWS Machine Learning Blog

Introduction to Amazon SageMaker Object2Vec  | AWS Machine Learning Blog

Overview of containers for Amazon SageMaker :: Amazon SageMaker Workshop

[AWS Summit Tokyo 2019] Amazon SageMaker Deep Dive


その他

Notes on Parameter Tuning — xgboost 1.5.0-SNAPSHOT documentation

 CS 230 - リカレントニューラルネットワーク チートシート

CS 230 - 深層学習のアドバイスやコツのチートシート

TensorFlowを使って学習率による動きの違いを確認する - Qiita

深層学習オプティマイザの比較評価|トレンドコラム|GPUサーバープラットフォームの設計/構築なら「技術力」のNTTPC

Optimizer入門&最新動向

sklearn.feature_extraction.text.TfidfVectorizer — scikit-learn 0.24.2 documentation

Visualization of SVM Kernels Linear, RBF, Poly and Sigmoid on Python (Adapted from: http://scikit-learn.org/stable/auto_examples/classification/plot_classifier_comparison.html)



0 件のコメント:

コメントを投稿