タグ

mathに関するteddy-gのブックマーク (52)

  • GPUがディープラーニングで用いられる理由を解説 - Qiita

    記事は フューチャー Advent Calendar 2023 18日目の記事です。 昨日は、@RuyPKG さんの「asdf で開発言語と利用ツールのバージョン管理」でした。 はじめに 近年ChatGPTやStable Diffusionなど、生成AIが脚光を浴びています。これらはディープラーニングという機械学習アルゴリズムが用いられており、その計算のためにGPUが広く使われています。記事ではGPUがディープラーニングで用いられる理由を解説します。 ディープラーニングでGPUが重宝される理由を理解するにはGPUの仕組みとディープラニングのアルゴリズムを簡単に理解する必要があるため、順に説明します。 GPUとは GPUとは並列計算を得意とするプロセッサで。映像出力を主な役割としてPCに取り付けられることが多いです。通常はグラフィックボードという基盤の上に取り付けられています。グラフィッ

    GPUがディープラーニングで用いられる理由を解説 - Qiita
    teddy-g
    teddy-g 2024/03/08
    GPUがどういう計算しているの?という説明で一番分かりやすい気がする。行列演算ゆえに並列化が可能で、行列演算ゆえに単純計算しかできない。なんかサウザーみたいな言い回しになった。
  • 因子分析をExcelで理解する - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 主成分分析とは似て非なる手法として「因子分析」(Factor Analysis) があります。 主成分分析(PCA)では、説明変数に対して重み行列(固有ベクトル)a を線形結合した「主成分」 yPC1を合成しました。ここで、主成分は、説明変数と同じ数だけ定義します。 yPC1 = a1,1 x1 + a1,2 x2 + a1,3 x3 + a1,4 x4 + a1,5 + ... 因子分析では、説明変数(観測変数)x が「因子」(factor) という潜在変数から合成されるという考え方に基づき、その因子得点 f と重み行列(因子負荷)

    因子分析をExcelで理解する - Qiita
    teddy-g
    teddy-g 2023/10/14
    因子分析をEXCELでやる方法…なんだけど、この通り進めていくと途中で手詰まりになる。おとなしくRかPython使った方が早い。
  • 編集距離についての説明及びPythonでの実装 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

    編集距離についての説明及びPythonでの実装 - Qiita
    teddy-g
    teddy-g 2021/10/31
    レーベンシュタイン距離の基本とPython実装について。比較する文字同士のマトリクスを作って比較していく。
  • フィボナッチを使ったテクニカル分析で相場の反転を見抜く方法 | 投資の教科書

    フィボナッチとは、イタリアの数学者のレオナルド・フィボナッチが唱えた「フィボナッチ数列」のことです。 相場の世界では、フィボナッチ数列を応用した「フィボナッチ・リトレースメント」というテクニカル分析があり、フィボナッチ比率に基づいた23.6%、38.2%、50.0%、61.8%、76.4%の比率に注目すると、値動きが読みやすくなります。 いわば、このフィボナッチは、価格の「支持帯」と「抵抗帯」を予測するテクニカル分析の一つです。特にFXでは、トレンドが発生しても一直線に進み続けることはなく、必ず上下動しながら、「押し目」と「戻し」を形成します。 そして、フィボナッチを使うと、押し目や戻しがどこで発生するかが予測しやすくなります。 そこで、この記事では、フィボナッチの引き方や基的な役割を説明し、その後、どのような使い方で利益を出すのか、トレード戦略まで具体的に解説しています。ぜひ参考にして

    フィボナッチを使ったテクニカル分析で相場の反転を見抜く方法 | 投資の教科書
    teddy-g
    teddy-g 2021/01/20
    上昇トレンドという言葉を英語に直そうとしてたらフィボナッチ数列とテクニカル分析のネタに行き当たった。実証できるかな。
  • 日本の中心はどの県だ?グラフ理論(ネットワーク)の基本的な諸概念 - アジマティクス

    Q:これは何の構造を表しているでしょう? グラフ理論 上の構造のように、頂点(ノードともいいます)の集まりと、2つの頂点をつなぐ辺(エッジともいいます)の集まりでできたもののことを「グラフ」あるいは「ネットワーク」と呼び*1、このような構造を研究する分野こそが「グラフ理論(Graph theory)」です。今回はそんなグラフを使うと、身近なものの新たな側面が見えてくる話。 (余談ですが「グラフ」という用語は、数学だと関数のグラフとか円グラフみたいなやつもあって検索精度が悪いです。グラフ理論に関してわからないことがあった場合に「グラフ ○○」や「グラフ理論 ○○」とググるよりも、「ネットワーク ○○」とググったほうが得たい情報にリーチしやすいというライフハックが知られています) さて、冒頭のグラフです。グラフ理論の知識なんかひとつもなくても、このグラフから読み取れることはいくつもあります。例

    日本の中心はどの県だ?グラフ理論(ネットワーク)の基本的な諸概念 - アジマティクス
    teddy-g
    teddy-g 2020/04/15
    日本地図を例にグラフ理論を解説している。Centralityの考え方もすんなり頭に入る。
  • 第 8 回 グラフの表現

    日の内容 8-1. グラフ 8-2. グラフの表現 このドキュメントは http://edu.net.c.dendai.ac.jp/ 上で公開されています。 8-1. グラフ プログラムで扱うデータ構造としてグラフを取り上げます。 グラフとは頂点とそれを結ぶ辺からなるものです。 頂点は vertex、 節、 node などの呼び方があります、辺は edge、枝、 branch とも言います。 辺に向きがないグラフを無向グラフ、 辺に向きがあるグラフを有向グラフと言います。 互いに接続している頂点の列を道(path)と言います。 無向グラフにおいて、全ての頂点の組合せについて道がある場合、そのグラフ は連結であると言います。 頂点に接続している辺の数をその頂点の次数、degree 、arityと言います。 有向グラフにおいては出る辺の数を出次数、out degree、入る辺の数を入次数、i

    teddy-g
    teddy-g 2018/01/27
    入次数(いりじすう)、出次数(でじすう)っていう言葉は違和感があるな。indegree、outdegree、まあ確かにそうなんだけど。
  • 情報量 | 情報エントロピー(平均情報量)の求め方とその取りうる値域の証明

    2021.03.30 情報量は「場合の数」の比を対数化したものである(情報の分野で、対数底として 2 を用いる)。例えば、コドンを一つ想定したとき、単にコドンと言われると、その取りうる場合の数は 4×4×4 = 64 通りとなる。次に、「コドンの 1 番目の塩基は T です。」という情報が得られたとする。この情報を知った後、コドンの取りうる場合の数は 1×4×4 = 16 通りになる。「コドンの 1 番目の塩基は T です。」という情報を知る前は 64 通り、知った後は 16 通りになる。このとき、「コドンの 1 番目の塩基は T です。」という情報の情報量は log(64/16) = 2 のように計算される。このように、情報量はある情報を「知る前の場合の数」と「知った後の場合の数」の比を対数化したもので定義される。 \[ p = \log\frac{\text{事前の場合の数}}{\te

    teddy-g
    teddy-g 2017/08/30
    パケットのビットのエントロピーを計算したくて調べた。256ビットだとエントロピーはMAX256になるということでいいのかしら。
  • Difference between Topological Data Analysis and Graph Technology

    teddy-g
    teddy-g 2017/03/31
    TDAと(Oracleの)グラフ技術の違いは何よ?って質問にGurjeetとAnthonyが回答してる。TDAは別空間に写像するからより汎用的という話。
  • Singular value decomposition and principal component analysis

    Citation: Wall, Michael E., Andreas Rechtsteiner, Luis M. Rocha."Singular value decomposition and principal component analysis". in A Practical Approach to Microarray Data Analysis. D.P. Berrar, W. Dubitzky, M. Granzow, eds. pp. 91-109, Kluwer: Norwell, MA (2003). LANL LA-UR-02-4001. Also available in the arXiv.org e-Print archive and in Adobe Acrobat (.pdf) format. Abstract. This chapter describe

    teddy-g
    teddy-g 2017/03/26
    SVDとPCAについて。ちょっと熟読したい。
  • 判別分析(マハラノビス)

    トップページ→研究分野と周辺→システムの評価→ 例えば二次元で考えると、x軸y軸平面に多数の点が散らばり、これが幾つかのグループに分かれているとする。判別分析では、新たな点が与えられたとき、どのグループに属するかを判別する。 判別分析には、幾つかの方法があり、「サポートベクターマシン(SVM)」のように区分する線を引く方法もある。 ここでは、マハラノビス距離を用いた判別分析について述べる。 マハラノビス距離 最も一般的に使われる距離はユークリッド距離である。一次元(例えばx軸上)では、x座標の差がそのまま距離となる。 例えば二つのグループがあるとき、新たな点が与えられてどちらのグループに属するかを判別する際、新たな点のx座標と双方のグループの中心とのユークリッド距離を測り、短い方に属すると考える事も出来る。 しかし、この方法では、以下のような場合に問題となる。 青い点と赤い点の二つのグルー

    teddy-g
    teddy-g 2017/01/11
    [unsupervisedlearning]マハラノビス距離に関し、2変数の場合が丁寧に説明してある。
  • 尤度の解説

    このドメインは お名前.com から取得されました。 お名前.com は GMOインターネットグループ(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。 日のドメイン登録業者(レジストラ)(「ICANNがレジストラとして認定した企業」一覧(InterNIC提供)内に「Japan」の記載があるもの)を対象。 レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2024年5月時点の調査。

    teddy-g
    teddy-g 2017/01/03
    ある観測データの下での仮説の確からしさが尤度。H0とH1の尤度の比がロッド値で、どっちが確からしいかを見るのに使う。
  • 【統計学】正規分布とカイ二乗分布の関係を可視化してみる。 - Qiita

    # 標準正規分布に従う乱数を30,000個生成 x = np.random.normal(0, 1, 30000) # 生成した乱数を2乗する【【ここがキモ!!!】】 x2 = x**2 # ヒストグラムの描画 plt.figure(figsize=(7,5)) plt.title("chi2 distribution.[k=1]") plt.hist(x2, 80, color="lightgreen", normed=True) # 自由度1のカイ二乗分布の描画 xx = np.linspace(0, 25 ,1000) plt.plot(xx, chi2.pdf(xx, df=1), linewidth=2, color="r") となります。このグラフを表示すると下記になります。 2乗しているので、全てプラスになるので$x=0$よりすべて右にデータが移っていて、 2乗なので、 $x

    【統計学】正規分布とカイ二乗分布の関係を可視化してみる。 - Qiita
    teddy-g
    teddy-g 2017/01/03
    カイ二乗分布と正規分布の関係がビジュアルに理解できる。正規分布の対数から計算されるマハラノビス距離が自由度=次元数のカイ二乗分布に従うのも納得。
  • 【数列】自然対数の意味 | 大人が学び直す数学

    前回書いたように、自然対数とネイピア数は、まだ出てきたての馴れ初めで、経験がほとんどないので正体もよく分かりませんが、それでも少しでも今後の足しになるように、分からないなりにもう少々いさがってみることにします。 「自然対数の底=ネイピア数」を表す式は上記でしたが、この式を読み込んで文章の言葉でおおざっぱに書くと、「”1”にほんのちょっぴりの数を足して、それを繰り返し累乗すると、ネイピア数ができる」 と書けます。 こんなふうに「1」を起点に「割っておいて累乗する」、という「カニ挟み」みたいな格好で作られているところがネイピア数の製法上のユニークな特徴です。 対数の起源 これを頭にとめながら、ここでもう一度 対数の起源 にさかのぼって振り返ってみることにします。 対数のところで勉強したように、もともと対数の発想は、電子計算機のない時代に、掛け算の計算を足し算に置き換えて簡単にできないか、とい

    teddy-g
    teddy-g 2017/01/02
    自然対数、ネイピア数とは何かという話と、金利計算の関係がよくわかる。
  • http://kamiyacho.org/ebm/ce201.html

    teddy-g
    teddy-g 2016/12/28
    k統計量、k検定、カッパ値の説明。(Po-Pe)/(1-Pe)で偶然起きない一致を評価する。機械学習の精度検定にも使える。
  • ボルツマンマシン

    トップページ→研究分野と周辺→ニューラルネットワーク→ ボルツマンマシンは、Hinton、Sejnowskiらによって1980年代半ばに開発された、確率的に動作するニューラルネットワーク。19世紀の物理学者で統計熱力学の創始者とされる、ボルツマン(Boltzmann)の名を用いた。 ネットワークの動作に温度の概念を取り入れ、最初は激しく徐々に穏やかに動作する(擬似焼きなまし法)ように工夫している。 最急降下法による誤差逆伝播法や、ホップフィールド・ネットワークは、局所解への捕捉が宿命的な問題としてある。 ボルツマンマシンは、確率的に敢えて良くない解に移動する事を取り入れ、局所解からの脱出を試み、成果を挙げた。しかし、計算時間が長い等の克服すべき課題もある。 ニューラルネットワークに擬似焼きなまし法を取り入れたものは、全て広い意味でのボルツマンマシンと考えられるが、ここでは、出力関数に取り入

    teddy-g
    teddy-g 2016/12/26
    ボルツマンマシンの話で出てくる擬似焼きなまし法をシンプルに説明。温度を高→低にすることで最適解を得る。シグモイドは徐々にそれっぽいものに落ち着く。
  • これで解決!シリーズ 大学物理 - ボルツマン分布

    ボルツマン分布ってなんだろう きみたち、そろそろ就職じゃろ?イシガス商事に入ってみないか?お給料は完全歩合制。きみたちはセールスマンだとして、商談を勝ち取ればお給料が増えるとする。でも、一個も商談を勝ち取らないと、お給料はゼロじゃ。 いやー、こんな会社(笑)。 商談を勝ち取る確率が1/2だったら、非常に話は簡単になるよね。二項分布ってやつじゃないの? そうね。お給料の平均をもらう人が一番多い、っていう分布(↓)になりそうだわ。 しかし、ここの社長としては困ったことが起きた。月々によって、従業員に配る全人件費がちがうんじゃ。社員たちがどのくらい商談を勝ち取るかどうかは、為替だの原油価格だの、不確定な要素にも左右されるので、社員に配る給料が予期せず上下してしまう。ところが社長としては、予測可能なほうがいい。そんなわけで、全従業員に配る給料の総額をあらかじめ決めてしまうことにした。固定費は変動し

    teddy-g
    teddy-g 2016/12/26
    ボルツマン分布は限られた資源を取り合いするときの場合の数が最大になるような分布=エントロピー(場合の数の比)が最大になるような分布。詳細説明は有料。
  • MLAC2013 数式を使わずイメージで理解するEMアルゴリズム - Wolfeyes Bioinformatics beta

    はじめに Machine Learning Advent Calendar 2013の15日目を担当する@yag_aysです.専門はバイオインフォマティクスという計算機を使って生物学をする分野で,生モノではなく遺伝子の文字列相手に格闘している大学院生です.今回は初心者の人を対象に,なるべく数式を使わずにEMアルゴリズムについて解説してみたいと思います. EMアルゴリズムは,SVMやニューラルネットワークといった華々しい機械学習の手法の一つではなく,機械学習の中で使われる尤度最大化という一部分を担当するアルゴリズムです.そのため多くの人にとってEMアルゴリズムは,それ単体を使ってみたりだとか独自に改良をしたりするような対象ではないでしょう.でも,EMアルゴリズムなんて仰々しい名前が付けられているだけあって,いざ自分の仕事に組み込む場合には中身を理解していないと「なぜEMアルゴリズムを使ったの

    teddy-g
    teddy-g 2016/12/07
    何という簡潔で明解な解説。EMアルゴリズムって何?と人に聞かれても説明できるな
  • トポロジーとホモロジー群 - 大人になってからの再学習

    ホモロジー群について、とてもわかりやすく解説しているスライドを見つけた。 広島大学の平岡先生によるものだ。 ■ ホモロジー群とその応用 (平岡 裕章 | 広島大学理学研究科) http://www2.math.kyushu-u.ac.jp/~hiraoka/applied_homology_for_non_math.pdf 今まで、トポロジーに関する分野は漠然とした知識しかなくて、参考書をいくつか買ってみたりしたものの、 いまひとつ何をする学問なのかわからずにいた。 だけど、このスライドはすごい。当に初学者向けにわかりやすく書かれて、今までの疑問がかなり晴れてスッキリとした。 これはお勧めだ。 参考までに、冒頭の導入部分のスライドを紹介してみる。 何かを学問の対象とする場合、まずは、その対象を分類することを試みる。 分類するためには、「これとこれは同じ」「これとこれは違う」と区別するため

    トポロジーとホモロジー群 - 大人になってからの再学習
    teddy-g
    teddy-g 2016/11/19
    リンク先の広岡先生の 資料が消えてるので、この記事を参照するしかない
  • 統計学のP検定とt検定について教えてください。

    大学院で研究をする際に道具として統計学を使っている者です. >質問:統計学のP検定とt検定について教えてください. P検定……? あまり聞き覚えがない検定名ですが,できましたら正式名称あるいはどのような場合に使用される検定か具体例を示して下さい.とりあえず「t検定」について説明します. t検定とは正式な定義はともかくとして「t分布を利用した有意性検定」と考えていただくとよいでしょう.……ただしこの説明で分かる人はある程度統計学を勉強した人であって,統計学初心者の人にとっては意味不明かもしれません. 抽象的に考えると分かりづらいので,実際にt検定がどのように使われているかを 具体例を使って説明します. 使用例:男性と女性との体重に差があるか? ───────────────────────────── 女性体重  51 48 51 52 45  平均値: 49.4 ─────────────

    統計学のP検定とt検定について教えてください。
    teddy-g
    teddy-g 2016/08/29
    この回答、t検定の説明としてやたら丁寧で詳細でわかりやすい。
  • 量子力学入門:固有状態とは何か?

    #04■固有状態とは? 作用素は「作用する」のですから入力とは違うものが出力されます。 そうでなければ作用したといえません。 しかし稀なケースとして、入力と全く同じものが出てくることもあります。 作用するのを忘れたわけでなく、正しく作用したにもかかわらず、入力と出力が一致するのです。 例えば、カンパリを入れるとカンパリソーダを出力し、焼酎を入れたら酎ハイを出す作用素に、「炭酸水」を入力した場合です。 炭酸水の炭酸水割りを作ると、結果は炭酸水です。 作用素は正しく機能しましたが、出力は入力と同じです。 作用した結果が作用する前と同じものであるとき、この入出力のことを固有状態といいます。 固有状態は作用素によって異なります。 その作用素に固有の(独特の)状態という意味で「固有状態」と呼ぶのです。 固有状態には重要な意味があります。それは、作用素が行う作用の「質」が固有状態に表れるということで

    teddy-g
    teddy-g 2016/08/26
    量子=状態=波動関数=固有ベクトルということらしい。