AWS Lambda用のレイヤーをWindows上のDockerで作成

AWS Lambda用のレイヤーをWindows上のDockerで作成

Lambdaレイヤーを作成する目的と問題

  • 目的

AWS Lambda関数で標準でないPythonライブラリ(今回の場合はopenai、linebot-sdkなど)を使用するには、それらのライブラリを事前に用意する必要がある。

以下2つの方法があり、

  • Lambda関数にソースコードとともにアップロード
  • Lambdaレイヤーを作成してLambda関数に適応させる

Lambdaレイヤーを作成する方法だと、

  • 複数のLambda関数で共有することができる
  • ソースコードとライブラリを別に管理できる

というメリットがある。
したがってLambdaレイヤーを作成する。

  • 問題

AWS Lambdaは、Amazon Linux上で実行されるため、使用するライブラリや依存関係はAmazon Linux環境に合わせる必要がある。
具体的に言うとWindows上でpythonライブラリを用意してアップロードしても謎のエラーが発生することがあるので避けた方が良い。

Dockerを使用して仮想環境上にAmazon Linuxを再現することでこの問題を解決する。

具体例をもとにその方法を記す。

日本語音声認識API主要5社比較

日本語音声認識API主要5社比較

5種類の音声認識APIを性能評価して比較

音声認識技術によって音声から文字起こししたい。
既存のAPIが複数あるため実験により性能を比較した。

基本情報↓


名前対応フォーマット無料枠料金備考
Microsoft Azure
Speech-to-Text
wav, ogg5時間/月1ドル/1時間
AWS
Amazon transcribe
wav, ogg, flac, mp3 など60分/月1.44ドル/1時間課金対象は1秒単位
Google Cloud
Speech-to-Text
wav, ogg, flac, mp3 など60分/月1.44ドル/1時間課金対象は15秒切り上げ
アドバンスト・メディア
AmiVoice
wav, flac, mp3 など60分/月99円/1時間課金対象は音声データ中の発話区間のみ
Apple
SpeechFramework
m4a1000リクエスト/1時間無料iOS
iPadOS
macOS限定

認識精度↓


実験対象Microsoft AzureAWSAmiVoiceGoogleApple
全部92.31%89.18%83.57%82.86%89.67%
ナレーション93.63%90.35%85.63%85.22%89.22%
セリフ90.78%87.83%81.21%80.14%90.19%
男性94.58%91.44%90.03%86.13%90.79%
女性89.97%86.85%76.92%79.49%88.52%

最も認識精度が高いのは「Microsoft Azure」。
安いのは「AmiVoice」。
AppleはiOSアプリなどに組み込んで使用する形式で使いづらいが無料。

最も精度の良かった「Microsoft Azure」の音声認識APIの使い方は以下の記事に記している。

以降、実験の詳細を記す。

Twitter API v2の使い方2 (ツイートのCSV出力からAWS上で定期実行するまで)

Twitter API v2の使い方2 (ツイートのCSV出力からAWS上で定期実行するまで)

取得ツイートのCSV出力からAWS上で定期実行するまで

Twitter APIというものを使うとTwitter上の情報を集めたりできて便利らしいので実験する。

取得ツイートのCSV出力 → AWS上で実行 → AWS上で定期実行
までの作業を一通り行う。

最終的に以下のようにする。



前回(ツイート取得まで)はこれ。

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×