格付けチェック「ジャンプ新連載」　第15回「すごいスマホ」
2022-05-21
software
格付けチェック「ジャンプ新連載」
真のジャンプ読者であればジャンプ新連載の1話を読んだだけで何話連載するか分かるはず。
週刊少年ジャンプ新連載の1話だけを読んで何話連載するか当てる。
掲載後1週間以内(2話が掲載されるまで)にやるはずが理由もなく一週間遅刻。
一応2話は読んでいない。
詳細は第1回に書いてある。
続きを読む

ブラウザで動画再生・加工・録画
2022-04-27
software
javascriptで動画加工をする
ブラウザで画像処理に続いて動画像処理。
動画ファイルを選択
選択した動画を再生
加工した動画を再生
加工した動画をダウンロード
これらをブラウザ上で実現。
HTML5とjavascript、優秀。
続きを読む

Azure音声認識APIの日本語モデルカスタマイズ 2. 音声＋トランスクリプト
2022-03-31
software
「Custom Speech」によってAzure音声認識APIの日本語モデルの精度を向上
前回行ったAzure音声認識APIの実験の続き。
前回↓
Azureの音声認識サービス「Speech to Text」にはユーザーのデータからモデルの再学習を行い認識精度を高める機能がある。
「Custom Speech」と呼ばれるその機能は「音声ファイル」、ラベル付きテキスト、音素による発音指定テキストなど様々なデータによるカスタマイズが可能。
扱う言語によって機能に制限があり、日本語は「プレーンテキスト」によるカスタマイズ以外はできないと書いてある。
前回「プレーンテキスト」によるカスタマイズを試したときに「音声＋トランスクリプト」もできそうな感じだったので実験する。
結果から言うと音声の学習はうまくいかない。
続きを読む

Azure音声認識APIの日本語モデルカスタマイズ 1. プレーンテキスト
2022-03-26
software
「Custom Speech」によってAzure音声認識APIの日本語モデルの精度を向上
前回行ったAzure音声認識APIの実験の続き。
Azureの音声認識サービス「Speech to Text」にはユーザーのデータからモデルの再学習を行い認識精度を高める機能がある。
「Custom Speech」と呼ばれるその機能は「音声ファイル」、ラベル付きテキスト、音素による発音指定テキストなど様々なデータによるカスタマイズが可能。
扱う言語によって機能に制限がある、日本語について確認。
あまりにマイナーな言語過ぎて「プレーンテキスト」によるカスタマイズ以外はできないようだ。
したがって「プレーンテキスト」を利用したazureの音声認識カスタマイズを行う。
続きを読む

Pythonを用いたAzure APIによる音声認識の方法
2022-03-25
software
Azure「Speech To Text」の使い方
音声認識技術によって音声ファイルをテキスト化したいという声がある。

音声認識技術によって
音声ファイルをテキスト化したい
以前、5種類の音声認識APIを比較した。
その結果、日本語の音声認識精度が最も高かったのはMicrosoft Azureの「Speech To Text」。
そこで、Microsoft Azure「Speech To Text」APIの使い方を記す。
続きを読む

マスターデュエルマリンセスデッキでプラチナ１到達
2022-03-12
software
遊戯王マスターデュエル
マスターデュエルとは「遊戯王マスターデュエル」という遊戯王OCGの超面白いゲームであり、プラチナ1とはマスターデュエルにおけるランクマッチの最高ランクを指す。
最高ランクといっても過半数勝つことができれば後は対戦数さえ稼げば達成できるので頑張ればなんとかなる。
今回頑張ってなんとかなったため記念にデッキを残す。
※マスターデュエルのランクマッチは1か月ごとにランクがリセットされ、その単位をシーズンと呼ぶ。
今回の記事はシーズン2(2月1日～28日)においてプラチナ1に到達したことについて記載している。

そうだね
続きを読む

日本語音声認識API主要5社比較
2022-03-01
software
5種類の音声認識APIを性能評価して比較
音声認識技術によって音声から文字起こししたい。
既存のAPIが複数あるため実験により性能を比較した。
基本情報↓
名前対応フォーマット無料枠料金備考
Microsoft Azure
Speech-to-Text wav, ogg 5時間/月 1ドル/1時間
AWS
Amazon transcribe wav, ogg, flac, mp3 など 60分/月 1.44ドル/1時間課金対象は1秒単位
Google Cloud
Speech-to-Text wav, ogg, flac, mp3 など 60分/月 1.44ドル/1時間課金対象は15秒切り上げ
アドバンスト・メディア
AmiVoice wav, flac, mp3 など 60分/月 99円/1時間課金対象は音声データ中の発話区間のみ
Apple
SpeechFramework
m4a 1000リクエスト/1時間無料 iOS
iPadOS
macOS限定
認識精度↓
実験対象 Microsoft Azure AWS AmiVoice Google Apple
全部 92.31% 89.18% 83.57% 82.86% 89.67%
ナレーション 93.63% 90.35% 85.63% 85.22% 89.22%
セリフ 90.78% 87.83% 81.21% 80.14% 90.19%
男性 94.58% 91.44% 90.03% 86.13% 90.79%
女性 89.97% 86.85% 76.92% 79.49% 88.52%
最も認識精度が高いのは「Microsoft Azure」。
安いのは「AmiVoice」。
AppleはiOSアプリなどに組み込んで使用する形式で使いづらいが無料。
最も精度の良かった「Microsoft Azure」の音声認識APIの使い方は以下の記事に記している。
以降、実験の詳細を記す。
続きを読む

格付けチェック「ジャンプ新連載」　第14回「地球の子」
2022-02-27
software
格付けチェック「ジャンプ新連載」
真のジャンプ読者であればジャンプ新連載の1話を読んだだけで何話連載するか分かるはず。
週刊少年ジャンプ新連載の1話だけを読んで何話連載するか当てる。
お正月の恒例行事なのでお正月に結果をまとめたい。
と言い続けて正月どころか旧正月も過ぎた。
詳細は第1回に書いてある。
続きを読む

格付けチェック「ジャンプ新連載」　第13回「あかね噺」
2022-02-20
software
格付けチェック「ジャンプ新連載」
真のジャンプ読者であればジャンプ新連載の1話を読んだだけで何話連載するか分かるはず。
週刊少年ジャンプ新連載の1話だけを読んで何話連載するか当てる。
お正月の恒例行事なのでお正月に結果をまとめたい。
といつも書いていたがすっかり忘れていた。
そのうちまとめるか来年に持ち越す。
詳細は第1回に書いてある。
続きを読む

Twitter API v2の使い方6[コウメ太夫氏の#まいにちチクショーを取得する]
2022-01-18
software
Twitter API v2を使って特定アカウントのツイートを取得
`Twitter API v2`の機能の中に`User Tweet timeline`というものがあり、これによって任意のアカウントのタイムラインを取得できる。
これを利用して、コウメ太夫氏のTwitterアカウントから「#まいにちチクショー」を取得する。
以下に示す「コウメ太夫百人一首」を作ることが目的。
続きを読む

Update your browser to view this website correctly. Update my browser now

格付けチェック「ジャンプ新連載」

javascriptで動画加工をする

「Custom Speech」によってAzure音声認識APIの日本語モデルの精度を向上

「Custom Speech」によってAzure音声認識APIの日本語モデルの精度を向上

Azure「Speech To Text」の使い方

遊戯王マスターデュエル

5種類の音声認識APIを性能評価して比較

格付けチェック「ジャンプ新連載」

格付けチェック「ジャンプ新連載」

Twitter API v2を使って特定アカウントのツイートを取得

格付けチェック「ジャンプ新連載」

javascriptで動画加工をする

「Custom Speech」によってAzure音声認識APIの日本語モデルの精度を向上

「Custom Speech」によってAzure音声認識APIの日本語モデルの精度を向上

Azure「Speech To Text」 の使い方

遊戯王マスターデュエル

5種類の音声認識APIを性能評価して比較

格付けチェック「ジャンプ新連載」

格付けチェック「ジャンプ新連載」

Twitter API v2を使って特定アカウントのツイートを取得

Azure「Speech To Text」の使い方