様々なポーズを取るキャラクタの実装

先日、ControlNetと呼ばれる深層ネットワークを用いて、一つの画像から複数のバリエーション画像を作る機能を実装した。https://kumahiyo.com/ai/controllnet-variation/これは土台となる画像に対してその輪郭…

AIを使った画像のバリエーション生成

先日、LINEボットを使った画像生成AIを作った。https://kumahiyo.com/ai/stable-diffusion-line/深層学習の一種であるStable Diffusionを利用しているのだが、このAIはテキストから画像を生成す…

画像から物体を検知するAIの作成

DETRと呼ばれる手法で画像から物体を検知するAIを実装した。画像をAIに渡すと、物体を枠で囲んで名前とともに教えてくれるものだ。DETRはCNNなどの画像認識のニューラルネットワークと組み合わせて構成されている。特徴はその内部にTransforme…

対話型AIの作成

LINEから投げかけられたテーマに対して、要約や対話を生成するためのAIを作成した。ベースに使ったプログラムは、GPT-3というChatGPTの土台に使われているもの。GPT-3はAPIアクセスができるため、学習などは必要なくレンタルサーバ等でも動かすことが…

LINEボットを使った画像生成AI

LINEから、作りたい画像のイメージをテキストとして入力すると、AIが画像を生成してくれるボットを実装した。画像生成AIのStable DiffusionとPython、そしてPHPを使っている。Stable DiffusionはGPUを利用するため…

用意した文章の中で回答するAIの作成

AIを作ろうとする場合、BERTやGPT-3のようないくつかの種類がある。BERTは用意した文章の中で答えを見つけて回答することが得意で、GPT-3は投げかけられたテーマに対する要約や対話を生成するのが得意。LINEを使っている時に、私への質問があっ…

学習画像が少ない場合に使える分類モデル

以前、動物画像を分類するLINEアカウントを作った。https://new.kumahiyo.com/ai/animal-classification-cnn/しかし、羊の判別が上手くいかなかった。恐らく学習画像の枚数が比較的少なかったために、羊の特…

動物画像を分類するLINEアカウント

LINEアカウントに動物画像を送ると、その動物が何なのかをスタンプで教えてくれる仕組みを作った。LINEから送られてくる画像をサーバに取り込み、その画像から写っている動物の種類を予測。その結果から、特定の動物(今回は犬、猫、羊、鳥)であると予測された場合に、…