AI論文データベース
Books&Companyは8月1日より、AI文章生成サービス「easy writer」の提供を開始します。「easy writer」は、高性能の音声認識AIを活用し、Web上で音声データをテキストデータに変換するサービス。文字起こしの利用時間は1カ月20時間で、利用料は月額2万円(税別)。編集作業など文字起こし以外のサービスは常時使用可能です。 ウェブ上で音声データをテキストデータに変換するサービス「easy writer」 2000人以上をインタビューした編集者が経験を元に設計したしたという「easy writer」では、インタビューや会議などで使える音声同時入力、ボイスレコーダーで録音した音声データのテキスト変換、句読点の自動付与、文章の切れ目での強制改行、変換したデータファイルのアップロードと共有やMicrosoft Wordへのエクスポートなどの機能を利用することができます。 e
絵心ゼロでもこのレベルよ。ラクガキからリアル画像を生成する「GauGAN」が今すぐ試せます2019.06.19 23:0027,165 小暮ひさのり ね?簡単でしょ? 以前こちらの記事で紹介した、NVIDIAのAIアルゴリズムの一種である、敵対的生成ネットワーク(GANs)という技術を利用した自動描き起こしツール「GauGAN」。 以前は動画でのデモに留まっていましたが、現在はWebサイト上でその機能を試せるようになっています。 Image: NVIDIA ResearchImage: NVIDIA Research絵心ゼロで美術1の僕が20秒で描いた作品がこちらです。よーく見るとアナザー地球のようなファンタジーでいびつなパーツもありますけど、これが一瞬にして生成されるって、魔法じみていてもはや驚きしかありません。 画伯、って読んでくれてもいいのよ? Source: NVIDIA
MITが音声から人物の顔の画像を生成する新たな画像解析モデルについての論文を発表しました。実際にどのようなクオリティの予測まで可能なのでしょうか。 声から顔を予測するSpeech2faceモデルとは? 提案された「Speech2Face」は、”音声のみから顔を予測し、画像を自動生成”することができるモデルです。 発話と外観には相関関係があるといわれており、年齢、性別、口の形、顔の骨の構造など、すべてが音声に影響を与えると考えられています。また、言語、アクセント、スピードなどは国、地域、文化などのアイデンティティを反映しています。 これらの音と顔の相関関係をYoutubeなどの動画から人物が話している様子を”顔”と”声”に分けて学習データとし、声から正確に顔が予測できるようにモデルを訓練します。 話者の年齢、性別、人種などの複数の属性を短い話セグメントを通して推測し、その後話者の顔を再構築す
この記事は、以下の方向けに執筆しています。 ・とにかくAIブームに乗りたい方 ・転職してAI案件に携わりたい方 ・AIに必要な知識だけをざっくり身に付けたい方 関連記事:AI人材になるにはスキルよりまず職種を選択しよう 清水亮さんがAI人材の不足を言われてから、人材不足感は一向に変わっておらず、むしろ不足感が強まっている。企業が本格的に取り組み始めたのに、検証できる人材が誰もいない。データ分析経験があったり、Pythonでnumpyとか少し触れる人が、AI人材として急に売れっ子になるのを何度も見てきたし、その流れはしばらく続くんだと思う。 BIベンダも最近その流れに乗って売り込み始めた。コンサル会社は、AIコンサルと言い始めた。SIベンダは、AIの専門部署をたくさん作り始めた。メーカーもR&D中心にAI人材を採用しはじめてる。 CONNPASSで機械学習と名の付くセミナーはすべて人気で埋ま
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く