Homepage
Open in app
Sign in
Get started
ax Inc. BLOG
AI to the power of X (JP)
Follow
最新記事
LLaVA : 画像に対して質問できる大規模言語モデル
LLaVA : 画像に対して質問できる大規模言語モデル
画像に対して質問できる大規模言語モデルであるLLaVAのご紹介です。
Kazuki Kyakuno
Jul 18
Grounded-SAM : 任意の物体をセグメンテーションできる機械学習モデル
Grounded-SAM : 任意の物体をセグメンテーションできる機械学習モデル
任意の物体をセグメンテーションできる機械学習モデルであるGrounded-SAMのご紹介です。
Kazuki Kyakuno
Jul 17
ailia SDKの無償範囲を拡大、個人の小規模商用目的での無償利用が可能に
ailia SDKの無償範囲を拡大、個人の小規模商用目的での無償利用が可能に
ailia SDKの個人利用の無償範囲を拡大しました。個人の小規模商用目的での無償利用が可能になります。ailia SDKは、API使用料のかからないAIを実現し、AIの民主化に貢献します。
Kazuki Kyakuno
Jul 15
Grounding DINO : 任意の物体を検出できる物体検出モデル
Grounding DINO : 任意の物体を検出できる物体検出モデル
任意の物体を検出できる物体検出モデルであるGrounding DINOのご紹介です。検出したい物体をテキストで指定すると、指定した物体のBounding Boxを取得可能です。
Kazuki Kyakuno
Jul 9
最新のAIモデル
G2P_EN : 英語のテキストを音素に変換する機械学習モデル
G2P_EN : 英語のテキストを音素に変換する機械学習モデル
英語のテキストを音素に変換する機械学習モデルであるG2P-ENのご紹介です。
Kazuki Kyakuno
Jun 26
CrossEncoderMmarco : 質問文と回答文の類似度を計算する機械学習モデル
CrossEncoderMmarco : 質問文と回答文の類似度を計算する機械学習モデル
質問文と回答文の類似度を計算する機械学習モデルであるCrossEncoderMmarcoのご紹介です。CrossEncoderMmarcoを使用することで、RAGにリランクの仕組みを導入し、精度を改善することが可能です。
Kazuki Kyakuno
May 6
PyannoteAudio : 話者分離を行うための機械学習モデル
PyannoteAudio : 話者分離を行うための機械学習モデル
話者分離を行うための機械学習モデルであるPyannoteAudioのご紹介です。PyannoteAudioを使用することで、高精度な話者分離が可能です。
Kazuki Kyakuno
Apr 18
Bert Network Packet Flow Header Payload : ネットワークへの攻撃検知を行うための機械学習モデル
Bert Network Packet Flow Header Payload : ネットワークへの攻撃検知を行うための機械学習モデル
ネットワークへの攻撃検知を行うための機械学習モデルであるBert Network Packet Flow Header Payloadを紹介します。パケットのHexデータを入力として、BERTを使用して、攻撃種別のタグを出力します。
Kazuki Kyakuno
Mar 31
Vision Outlooker for Visual Recognition:視覚認識のための見通し視覚
Vision Outlooker for Visual Recognition:視覚認識のための見通し視覚
ailia SDKで使用できる機械学習モデルである「Vision Outlooker for Visual Recognition(以下、VOLO)」のご紹介です。 ailia SDKはエッジ向け推論フレームワークであり、ailia…
Taketo Kimura
Mar 3
最新のAI技術
Transformerの量子化の最新動向
Transformerの量子化の最新動向
Transformerは量子化の難しいネットワークとして知られています。本記事では、Transformerの量子化に関する最近の動向を紹介します。
Kazuki Kyakuno
Jun 23
I8MM: INT8 行列積向け ARM 拡張
I8MM: INT8 行列積向け ARM 拡張
INT8の行列積の計算を行うことができるI8MM の使い方の紹介です。
Ryohei Nishimura
Dec 5, 2023
T5を使用してWhisperの音声認識誤り訂正を行う
T5を使用してWhisperの音声認識誤り訂正を行う
Whisperの出力するテキストにT5を適用することで、音声認識誤り訂正を行う方法を紹介します。
Kazuki Kyakuno
Nov 9, 2023
CALM2–7B-CHATのOpenAI互換サーバを立てる
CALM2–7B-CHATのOpenAI互換サーバを立てる
サイバーエージェントの公開した最新のローカルLLMであるCALM2–7B-CHATのOpenAI互換サーバを立てる方法を解説します。
Kazuki Kyakuno
Nov 3, 2023
IP AdapterとStable Diffusion WebUIを使用してキャラクターを固定した画像を生成する
IP AdapterとStable Diffusion WebUIを使用してキャラクターを固定した画像を生成する
IP AdapterとStable Diffusion WebUIを使用してキャラクターを固定した画像を生成する方法を解説します。
Kazuki Kyakuno
Oct 5, 2023
About axinc
Latest Stories
Archive
About Medium
Terms
Privacy
Teams