Amazon SageMakerのビルトインアルゴリズムとその用例をまとめる

AWS 認定 機械学習 – 専門知識」の試験対策に。


BlazingText

BlazingTextは単語ベクトルを生成する手法であるWord2Vecの実装。
感情分析、名前付きエンティティ認識、機械翻訳など、多くの下流の自然言語処理(NLP)に利用できる。

DeepAR Forecasting

スカラー時系列を予測するための教師あり学習アルゴリズム。
例えばさまざまな商品に対する需要、サーバーの負荷、およびウェブページのリクエストを時系列でグループ化することができる。

Factorization Machines

因数分解機アルゴリズム。
分類タスクと回帰タスクの両方に使用できる汎用の教師あり学習アルゴリズム。
例えば、クリック予測システムでは、特定の広告カテゴリの広告が特定のページカテゴリのページに配置されたときに確認されたクリック率パターンをキャプチャできる。

Image Classification

教師ありイメージ分類アルゴリズム。
画像から物体を検出する用途に利用できる。

IP Insights

IPv4アドレスの使用パターンを学習する教師なし学習アルゴリズム。

IPアドレス不正検知に利用できる。
例えば、異常なIPアドレスからウェブサービスにログインしようとしているユーザーを識別したり、異常なIPアドレスからコンピューティングリソースを作成しようとしているアカウントを識別するなど。

k-means

教師なしクラスタリングアルゴリズム。

k-nearest-neighbor (k-NN)

k近傍法(k-NN)アルゴリズム。
教師あり。
クラス分類・回帰分析に利用できる。レコメンドなど。

LDA

潜在的ディリクレ配分 (Latent Dirichlet Allocation) アルゴリズム。
教師なし学習。
文書のトピック分類など。

Linear Learner

教師あり線形学習アルゴリズム。
予測・分類。

Neural Topic Model

ニューラルトピックモデル (NTM) アルゴリズム
教師なし。
統計的分布に基づく単語のグループ分け。

Object2Vec

単語に対するWord2Vec埋め込み手法を、文や段落などのより複雑なオブジェクトに対しても使用できるよう、汎用化したもの。

Object Detection

教師ありオブジェクト検出アルゴリズム。
物体検知。

PCA

主成分分析法 (principal component analysis) アルゴリズム。
教師なし。

Random Cut Forest

ランダムカットフォレスト (RCF) アルゴリズム
データセット内の異常なデータポイントを検出する、教師なし学習のアルゴリズム。
異常検知。

Semantic Segmentation

セマンティックセグメンテーションアルゴリズム。
イメージ内のすべてのピクセルに、事前定義された一連のクラスのクラスラベルを付ける。

Seq2Seq Modeling

Sequence to Sequence アルゴリズム。
教師あり。
機械翻訳・テキスト要約・音声認識。

XGBoost(eXtreme Gradient Boosting)

決定木(decision tree)アルゴリズム
回帰、分類(バイナリ・複数クラス)、ランキングに使用できる。
教師あり。