Homepage
Open in app
Sign in
Get started
ax Inc. BLOG
AI to the power of X (JP)
Follow
最新記事
G2P_EN : 英語のテキストを音素に変換する機械学習モデル
G2P_EN : 英語のテキストを音素に変換する機械学習モデル
英語のテキストを音素に変換する機械学習モデルであるG2P-ENのご紹介です。
Kazuki Kyakuno
Jun 26
Transformerの量子化の最新動向
Transformerの量子化の最新動向
Transformerは量子化の難しいネットワークとして知られています。本記事では、Transformerの量子化に関する最近の動向を紹介します。
Kazuki Kyakuno
Jun 23
ailia AI Voice : UnityやC++から使用できるAI音声合成ライブラリ
ailia AI Voice : UnityやC++から使用できるAI音声合成ライブラリ
UnityやC++から使用できるAI音声合成ライブラリであるailia AI Voiceのご紹介です。ailia AI Voiceを使用することで、簡単にアプリケーションにAI音声合成を実装することが可能です。
Kazuki Kyakuno
Jun 18
ailia SDK 1.4.0をリリース
ailia SDK 1.4.0をリリース
STFTやCol2Imなど新たなレイヤーと、cuDNN9に対応したailia SDK 1.4.0をリリースしました。
Kazuki Kyakuno
Jun 10
最新のAIモデル
CrossEncoderMmarco : 質問文と回答文の類似度を計算する機械学習モデル
CrossEncoderMmarco : 質問文と回答文の類似度を計算する機械学習モデル
質問文と回答文の類似度を計算する機械学習モデルであるCrossEncoderMmarcoのご紹介です。CrossEncoderMmarcoを使用することで、RAGにリランクの仕組みを導入し、精度を改善することが可能です。
Kazuki Kyakuno
May 6
PyannoteAudio : 話者分離を行うための機械学習モデル
PyannoteAudio : 話者分離を行うための機械学習モデル
話者分離を行うための機械学習モデルであるPyannoteAudioのご紹介です。PyannoteAudioを使用することで、高精度な話者分離が可能です。
Kazuki Kyakuno
Apr 18
Bert Network Packet Flow Header Payload : ネットワークへの攻撃検知を行うための機械学習モデル
Bert Network Packet Flow Header Payload : ネットワークへの攻撃検知を行うための機械学習モデル
ネットワークへの攻撃検知を行うための機械学習モデルであるBert Network Packet Flow Header Payloadを紹介します。パケットのHexデータを入力として、BERTを使用して、攻撃種別のタグを出力します。
Kazuki Kyakuno
Mar 31
Vision Outlooker for Visual Recognition:視覚認識のための見通し視覚
Vision Outlooker for Visual Recognition:視覚認識のための見通し視覚
ailia SDKで使用できる機械学習モデルである「Vision Outlooker for Visual Recognition(以下、VOLO)」のご紹介です。 ailia SDKはエッジ向け推論フレームワークであり、ailia…
Taketo Kimura
Mar 3
GPT-SoVITS : ファインチューニングできる0ショットの音声合成モデル
GPT-SoVITS : ファインチューニングできる0ショットの音声合成モデル
ファインチューニングできる0ショットの音声合成モデルであるGPT-SoVITSの紹介です。GPT-SoVITSを使用することで、高品質な日本語音声合成が可能です。
Kazuki Kyakuno
Feb 25
最新のAI技術
I8MM: INT8 行列積向け ARM 拡張
I8MM: INT8 行列積向け ARM 拡張
INT8の行列積の計算を行うことができるI8MM の使い方の紹介です。
Ryohei Nishimura
Dec 5, 2023
T5を使用してWhisperの音声認識誤り訂正を行う
T5を使用してWhisperの音声認識誤り訂正を行う
Whisperの出力するテキストにT5を適用することで、音声認識誤り訂正を行う方法を紹介します。
Kazuki Kyakuno
Nov 9, 2023
CALM2–7B-CHATのOpenAI互換サーバを立てる
CALM2–7B-CHATのOpenAI互換サーバを立てる
サイバーエージェントの公開した最新のローカルLLMであるCALM2–7B-CHATのOpenAI互換サーバを立てる方法を解説します。
Kazuki Kyakuno
Nov 3, 2023
IP AdapterとStable Diffusion WebUIを使用してキャラクターを固定した画像を生成する
IP AdapterとStable Diffusion WebUIを使用してキャラクターを固定した画像を生成する
IP AdapterとStable Diffusion WebUIを使用してキャラクターを固定した画像を生成する方法を解説します。
Kazuki Kyakuno
Oct 5, 2023
3D Gaussian Splatting : 複数視点の画像から3D空間を再現する最新手法
3D Gaussian Splatting : 複数視点の画像から3D空間を再現する最新手法
複数視点の画像から3D空間を再現する最新手法である3D Gaussian Splattingの紹介です。3D Gaussian Splattingを使用することで、3D空間を学習し、リアルタイムにレンダリング可能です。
Kazuki Kyakuno
Sep 25, 2023
About axinc
Latest Stories
Archive
About Medium
Terms
Privacy
Teams