サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
インタビュー
ja.nishimotz.com
PATH を C:\Program Files (x86)\7-Zip とかに通せば、コマンドプロンプトで 7z が呼び出せる。 コマンドラインで .bzr* .git* を除外してアーカイブを作るには: > cd C:\work\nvda\miscdep > 7z a -xr!.bzr* -xr!.git* ..\miscdep.7z * ディレクトリひとつ上から App の中身をzipアーカイブし、.bzr* を除外する: >7z a -xr!*\.bzr* App.zip App
文系の学生向けと思われる入門書:緒賀 郷志「Rによる心理・調査データ解析」 Excel (または OpenOffice Calc)でデータを入力してクリップボードにコピーし、 read.delim("clipboard") でデータフレームとして読み込む手順などが説明されている。 <html> <div class="amazlet-box" style="margin-bottom:0px;"><div class="amazlet-image" style="float:left;"><a href="http://www.amazon.co.jp/exec/obidos/ASIN/4489020678/r4wh-22/ref=nosim/" name="amazletlink" target="_blank"><img src="http://images-jp.amazon.com
オープンソースのスクリーンリーダーNVDAとその日本語化(2011-11-18 日本音響学会東海支部 技術講習会 視覚・聴覚障害のための支援技術の現状と展望)
wave ファイルを読み込んで、別のファイルに書き込む。 参考 numpy / scipy を使わなくてよい方法を知りたいので、試行錯誤する。 とりあえず wave を使ってみる。16bit mono 48KHz sampling を対象としている。 C:\>python Python 2.6 (r26:66721, Oct 2 2008, 11:35:03) [MSC v.1500 32 bit (Intel)] on win32 Type "help", "copyright", "credits" or "license" for more information. >>> import wave >>> a = wave.open("c:/data/A01.wav") >>> a <wave.Wave_read instance at 0x00A108C8> >>> a.getnc
HTK は隠れマルコフモデルによる音声認識のツールキット。 ケンブリッジ大学の技術をもとに製品化された有償のソフトウェアだったが、開発元が Microsoft に買収され、その後無料で公開された。 現在は厳密な意味でのオープンソースプログラムではなく、配布元でユーザ登録すれば入手・利用できる。 http://htk.eng.cam.ac.uk/ 特徴量計算の部分を自前で用意することで画像認識などにも応用できる。 ATK : Application Toolkit for HTK が提供されている。 HTK のパッチとして音声合成ツールキットHTSが公開されている。 コマンド hvite <html> <div class="amazlet-box" style="margin-bottom:0px;"><div class="amazlet-image" style="float:left
参考:Ruby1.8.7、1.9.1、1.9.2preview1を簡単に切り替える@Ubuntu9.10 (update-alternatives の使い方解説) 「複数のバージョンのRubyを入れるには、「./configure –program-suffix=187」のように –program-suffix をつけてコンパイル・インストールすればよい。もっと徹底するには「./configure –prefix=/pkgs/ruby-1.8.7 –program-suffix=187」のように –prefixをつけておく。 そして実行スクリプトの#!行には「#!/usr/bin/env ruby187」のようにバージョンも付記しておく」 VMware Player の中で動いている ubuntu 9.04 で ruby-1.9.1 の deb パッケージを作る。 そして gem がちゃん
openni に移行する人が増えているようだ。 CL NUI Platformというものも。 http://www.drdobbs.com/windows/229000752 libfreenect は Apache 2.0 と GPL 2.0 のデュアルライセンス。 since 2010-12-01 センサー単体版を購入すれば PC につなぐ USB 変換ケーブルが手に入る。XBox 360 セットを買ってしまうと手に入らないらしい。 http://openkinect.org/wiki/Getting_Started Ubuntu 9.04 (32bit) で Wiki のとおりで動いたので記録しておく。 sudo apt-get install cmake libusb-1.0-0-dev libglut3-dev git clone https://github.com/OpenK
since 2010-11-19 Speech Synthesis Markup Language (SSML)は W3C が標準化を進めている音声合成マークアップ言語。 W3C は 2010年9月に Speech Synthesis Markup Language (SSML) Version 1.1 を Recommendation にした。
start 目次 自己紹介と技術情報 株式会社シュアルタ オフィスと連絡先 nishimotz の情報 活動 覚え書き このサイトの情報 自己紹介と技術情報 西本卓也 (Takuya Nishimoto) 株式会社シュアルタ Facebookページ 会社概要 nishimotzの事業 kikurakoの事業 ペットについてのあれこれブログ オフィスと連絡先 〒732-0828 広島県広島市南区京橋町1−7 アスティ広島京橋ビルディング1階(fabbit広島駅前) 電話 050-3196-3652 ファクス 050-3156-3652 info [at] shuaruta.com nishimotz の情報 LinkedIn Docswellスライド slideshareスライド 学歴と職歴 職務経歴 バイオグラフィ 著書 学会発表 YouTube 動画 nishimotzの日記 Twitt
Juliusはオープンソースの汎用大語彙連続音声認識エンジン。 バージョン4からJulianと統合。 2011年12月にバージョン 4.2.1 がリリースされた。 2013年6月にバージョン 4.2.3 がリリースされた。 since 2012-03-22 ネットで見つけた情報: ルールベースの juliusと精度 - お前の血は何色だ!! 4 http://bit.ly/GKkt53 ルールベースjuliusの誤認識対策にSVMを利用してみよう - お前の血は何色だ!! 4 http://bit.ly/GM10vc OLL によるオンライン学習を試してみた - 凹みTips http://bit.ly/GFghmB
<html> <div class="amazlet-box" style="margin-bottom:0px;"><div class="amazlet-image" style="float:left;margin:0px 12px 1px 0px;"><a href="http://www.amazon.co.jp/exec/obidos/ASIN/4274068668/r4wh-22/ref=nosim/" name="amazletlink" target="_blank"><img src="http://ecx.images-amazon.com/images/I/51Gibg-iYTL._SL160_.jpg" alt="RailsによるアジャイルWebアプリケーション開発 第4版" style="border: none;" /></a></div><div class
非 Rubyist に送る、失敗しない ruby 実行環境構築方法 - tomykaira makes love with codes http://bit.ly/AdP4Cq since 2013-04-10 $ rvm autolibs enable $ sudo rvm install 1.9.3 $ rvm use 1.9.3 --default rvmsudo が "Warning: can not check `/etc/sudoers` for `secure_path`" という警告を出すという話 since 2011-07-21 Leopard 以降の Mac には ruby も gem も rails も入っている。 http://developer.apple.com/tools/developonrailsleopard.html しかし、バージョンが古いので、新し
最初は Twitter での @mamiccho さん @KitLit さんとの議論。Twitter で得た情報などを随時加筆しています。情報提供や誤りの指摘などを歓迎します。 DAISY = Digital Accessible Information System. もともとは視覚障害を持つ人が音声化された書籍(音訳図書)を聞くためのCD-ROMフォーマット。点字図書館などで広く使われている。 現在は読書に障害を持つ人を対象としたマルチメディア技術と再定義されている。また、媒体も CD-ROM に限定されない。
$ /usr/local/bin/open_jtalk The HMM-based speech synthesis system (HTS) Open JTalk version 1.01 (http://open-jtalk.sourceforge.net/) Copyright (C) 2008-2010 Nagoya Institute of Technology All rights reserved. The HMM-based speech synthesis system (HTS) hts_engine API version 1.03 (http://hts-engine.sourceforge.net/) Copyright (C) 2001-2010 Nagoya Institute of Technology 2001-2008 Tokyo Institute o
公開リポジトリを他者がフォークしたものからのプルリクエストには、Review App は自動デプロイされない。 (セキュリティと課金を防ぐため) Procfile web: npm start package.json { "name": "****", "version": "1.0.0", "description": "", "main": "index.js", "scripts": { "dev": "next", "start": "next start -p $PORT", "build": "next build", "export": "next export --outdir=./docs", .... app.json { "addons": [ ], "buildpacks": [ ], "env": { }, "formation": { "web": { "qu
since 2022-12-24 ruby 3.1.2 irb(main):016:1* def add(a, b) irb(main):017:1* a + b irb(main):018:0> end => :add irb(main):019:0> add 1, 3 => 4 irb(main):020:1* def add_new a, b irb(main):021:1* a + b * 2 irb(main):022:0> end => :add_new irb(main):023:0> add_new 1, 3 => 7 irb(main):024:1* def fizzbuzz(num) irb(main):025:1* num irb(main):026:0> end => :fizzbuzz irb(main):027:0> 1.upto(10) { puts fizz
島根県CMSを参考にスクラッチから開発。GalateaTalkも使用「徳島県がRubyの独自開発CMS「Joruri」でサイトを刷新,OSSとして公開へ」 http://bit.ly/6KugCP GalateaTalk (gtalk) 関連の利用状況を確認する。 作業環境は Ubuntu Linux 9.04 である。日常的に Galatea Toolkit や Ruby on Rails の開発に使っている環境。 2009年8月8日現在の最新版である 1.1.0 のソースを確認してみる。 $ tar xvfz pref-shimane-cms-1.1.0.tar.gz $ cd pref-shimane-cms-1.1.0 音声合成関連は tool/gtalk/ にある。 $ ls -1 tool/gtalk/ gtalk/ morph/ rubi-adder/ speakers/ v
このページを最初にブックマークしてみませんか?
『自己紹介と技術情報 [ja.nishimotz.com]』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く