タグ

mathに関するteddy-gのブックマーク (52)

  • 共分散の意味と簡単な求め方 | 高校数学の美しい物語

    共分散は, 「XXX の偏差 × YYY の偏差」の平均 で定義されます。 ※偏差とは平均との差のことです。 定義だけでは共分散の意味は分かりにくいので,簡単な具体例で計算してみます。 555 人でテストを受けたデータを考える。 X:X:X: 国語の点数,YYY :数学の点数。 各々の点数は,(50,50),(50,70),(80,60),(70,90),(90,100)(50,50),(50,70),(80,60),(70,90),(90,100)(50,50),(50,70),(80,60),(70,90),(90,100) このときの共分散を計算してみましょう。 まず,国語の平均点 μX\mu_XμX​ は, μX=15(50+50+80+70+90)=68 \mu_X=\dfrac{1}{5} (50+50+80+70+90)=68 μX​=51​(50+50+80+70+90)=

    共分散の意味と簡単な求め方 | 高校数学の美しい物語
    teddy-g
    teddy-g 2015/12/01
    相関係数との関係といい、共分散の説明としては一番すんなり頭に入った。
  • マインドウエア総研 | 技術情報 | SOMデータマイニング解説

    SOMのマップを見るときに重要なポイントは、各属性(変数)の値が、マップの領域でどのように分布しているかということです。領域ごとに、どの属性の値が高いか?低いか?を見ます。マップの可視化によって、直観的にそれを判断できるのがSOMの強みでもありますが、反面、可視化のみに頼った分析では定量的な分析ができません。Viscoveryでは、SOMのマップ上で定量的な分析もできるように改良されておりますが、Viscovery以外のSOMでは可視化に頼りすぎる点が最大の欠点でもあります。 初心者がSOMのマップを見たときに最もよく出る疑問は、「マップの縦と横は何?」ということなんですが、SOMはデカルト座標の縦軸・横軸を意味しておりません。前のページで述べたように、多次元空間内でデータが分布している密度の高いところに、2次元の柔軟な格子を沿わせて自由曲面を形成しています。SOMのノードは、多次元空間で

    teddy-g
    teddy-g 2015/06/08
    SOMを使ったソフトなんてあったんだな。広い意味ではSOMもTopologyと同じカテゴリ。
  • なるほど統計学園高等部 | ローレンツ曲線

    特徴 ローレンツ曲線はある事象の集中の度合いを示す曲線で、所得や貯蓄の格差などを示す時に有効なグラフです。 ローレンツ曲線は階級ごとに集計された数値を使用します。階級値の小さい方から順に並べ、横軸に、各階級の度数(人数など)を全体の度数で割った「相対度数」を累積して並べた累積相対度数をとり、縦軸に、階級値と度数を掛け合わせ、全体に占める割合を累積していった値(累積配分比率)をとります。 中央の斜線は均等配分線といい、階級ごとの人数が同じになることなどにより、完全に均等に配分された場合を表しています。 作成方法 データを使用してローレンツ曲線を作成してみましょう。 ① まず、横軸の累積相対度数を算出します。下図のように階級の小さい順に累積度数を作成します。 ② 全体の度数で各階級の度数を割った累積相対度数を算出します。 作成されたグラフが原点を通るよう、先頭に「0」の値を入れておくとよいでし

    teddy-g
    teddy-g 2015/05/20
    ディシジョンツリー(CART)で出てくるジニ係数を分かりやすく説明してある。ふむふむ。
  • 分散と標準偏差の違いは?|公差解析の効率化/幾何公差化の実現に Sigmetrix:サイバネット

    ではなぜ一般的にばらつきの大きさを示す際、分散ではなく標準偏差が用いられるのでしょうか。 まずばらつき具合の評価ですが、例えば装置A、装置Bそれぞれで製造した部品の長さばらつきを下図に示します。 この場合、どちらの装置を使っても長さの平均は「10mm」になります。 次に、それぞれの装置で製造される部品について、全体での長さばらつき具合を数値化するため、 ばらつき=Σ(測定値−平均値) を求めてみます。 しかしながら、この式ではプラス側のばらつきとマイナス側のばらつきが相殺してしまい、結局どちらの装置の結果も「0」となってしまいます。 そこで符号の影響を排除するために、 ばらつき=Σ(測定値−平均値)2 でばらつきを求めてみます。 この式で求めたばらつきは、装置Aが「0.38」、装置Bが「1.10」となり、装置Bの方がばらつきが大きいことが、数値として確認できます。 ただし、この算出方法では

    分散と標準偏差の違いは?|公差解析の効率化/幾何公差化の実現に Sigmetrix:サイバネット
    teddy-g
    teddy-g 2015/02/12
    何か知らんが分散の説明では一番分かりやすいように思った。
  • ホモロジーとホモトピーの違いって何ですか? - 佐藤肇先生の『位相幾何』(岩波書店)の冒頭にはこう書かれています。「位相幾何は、つながっ... - Yahoo!知恵袋

    佐藤肇先生の『位相幾何』(岩波書店)の冒頭にはこう書かれています。 「位相幾何は、つながっているか、離れているかという質的な違いのみを見つけていろいろな図形を分類する。 図形の穴の数を1コ、2コと数えるのは一つの表現であろう。また穴とは何で、穴の数はどのように数えられるものであろうか。実は、それを数学的に説明するのがホモトピー群、ホモロジー群、コホモロジー群であり、さらに図形の曲がり具合の程度を表すのが特性類である。直感的にいえば、i次元のホモトピー群は、i次元の“丸い穴”の様子を見ており、i次元のホモロジー群は、i次元の“部屋”の数を調べているということができるであろう。」 位相幾何の入門でまず勉強するのはホモロジーと基群ですね。基群はホモトピーの1次元版です。つまり基群をさらに高次元化したものがホモトピー群です。 位相幾何は微分幾何などではとらえきれない、連続性や穴を調べる学問

    ホモロジーとホモトピーの違いって何ですか? - 佐藤肇先生の『位相幾何』(岩波書店)の冒頭にはこう書かれています。「位相幾何は、つながっ... - Yahoo!知恵袋
    teddy-g
    teddy-g 2015/02/08
    でもってホモロジーとホモトピーの違いとは何かと。ホモロジーで考えた方がいい。たぶん。
  • 単体、単体的複体 | quvoxノート

    teddy-g
    teddy-g 2014/12/20
    単体的複体とは何ぞやというのが簡単に書いてある。
  • 中川雅央 付表:三角乱数列 triangular random numbers

    teddy-g
    teddy-g 2009/07/05
    このページのJavaScript読んでやっと三角乱数の発生方法がわかった。
  • Bayesianって<br>どういう考え方なんだろう

    *********** お知らせ *********** YukiWikiによるベイズ統計ファンサイト を開設しました。 このページ「Bayesianってどういう考え方なんだろう」は、 以上のファンサイトへ発展的解消いたします。 どうぞご贔屓に! ********************************* ベイズ理論は、 普通の確率論とは一風異なる確率理論です。 この小文では、ベイズ理論の意味・意義について 私がこれまでに学び、考えたことについて整理を試みます。 とかく、<宗教的信念>のごとくに扱われがちのベイジアン思想ですが そのおかしいところ、よいところなど、基準を明確にして検証していけたら いいな、というのが目標です。 私自身勉強中の身なので定説と異なることを述べていたり、 明らかな間違いもあるかもしれません。 そのつもりでだまされ

    teddy-g
    teddy-g 2007/06/20
    ベイズ理論のわかりやすい説明。続き書いてほしいなあ。
  • ウェブ上の日英非対訳文書を用いた訳語対応推定

    私は、ウェブ上の文書を用いて、英語と日語の訳語対応を推定する研究を行っています。 1.どんな研究なの? この研究の内容は一言でいうと、「訳の分からない英語の訳語を、ウェブを利用して自動で見つけてくる」というものです。 例えば、皆さんが英語の新聞記事を読んでいて、訳の分からない「advance team」という語を見つけたとします。普通皆さんが分からない語に出会った場合には、英和辞典などを使って訳語を調べますね? ところが、この「advance team」は最近よく使われるようになった語で、辞書には載っていませんでした。さて、どうしましょう? ・・・こういうときに、この研究が役に立つのです。 私達のシステムでは、まず報道記事を利用して、「advance team」の訳だと思われる日語、「先遣隊」「他国領土」「隊派遣」「報道陣」などを見つけてきます。 次に、ウェブを利用して、こ

    teddy-g
    teddy-g 2006/10/21
    どうやって似たページだと判定するかのアイデア。
  • もういちどだけ内積・外積 [物理のかぎしっぽ]

    この記事の前半では,ベクトルの掛け算である内積と外積を,もう一度じっくり考え直してみます.得になるような話は何も出てきませんので,『もうよく分かってるよ』という人は読まなくてもいいでしょう.内積や外積の計算をしていて,特に何も問題を感じない,という人も読まなくていいでしょう.『一応,計算方法は知ってるけど,なんだか意味がよく分からなくて,気持ちワルイ!』という人,どうぞ読んで見てください.高校生でも読める解説を目指しましたが,とことん理解したいという頑固な人を読者として想定していますので,少し高度な内容も含みます.発展的な内容に関しては,それに関連する分野に触れました.今後の勉強の指針になればと思います. 最後のセクションでは,テンソルの概念に少し触れます. ベクトルの掛け算 まず二つのベクトル , を次のように定義します.この記事で出てくるベクトルは全て 次元とします.太字の というのは

    teddy-g
    teddy-g 2006/10/21
    ベクトルの計算。
  • ベクトル空間モデル

    0.1 ベクトル空間モデル 重み付けと最大頻度での正規化 (Croft) tfji 最良優先検索 検索結果として得られた文書集合にも、質問 への適合の度合は一様ではない。最良優先検 索は、適合の度合によって検索結果の文書集 合を順位付けておく方法である。利用者には 上位 から順 に提示す ることに なる。これ に よって、完 全一 致検 索の 欠 点を 克服 して お り、最近 では よく 使わ れ るよ うに なって き た。最 良優先 検索のモ デルには 確率モデ ル (Robertson & Jones, 1976)、拡張ブーリア = K f (i; + (1 0 K ) maxreqreqj()i; j ) f i;j log および文書におけるターム数で正規化 (Harman) log2(f req (i; j ) + 1) tf = log2 (文書j 中のター

    teddy-g
    teddy-g 2006/10/20
    ベクトル空間モデル
  • もう一度ベクトル2(ベクトルの読み書きそろばん) [物理のかぎしっぽ]

    0. 複数個のベクトルの取り扱いはどうするのか ベクトルが1つしか出てこない場合よりも複数個出てくる状態の方がより一般的 ということには納得していただけるでしょうか? 例えば,物体に働く力を考える際,二つ以上の力が働かないと物体が釣り合うことは ありませんし,その力のかかっている角度しだいで運動する向きも変わってきます. 速度を考える際にも川を泳いで渡るときの状況を考えてみれば,実際の速度ベクトルは 「自分の泳いでいる速度ベクトル」と,「川の流れの分の速度ベクトル」との合成になり, "流されながら泳ぐ"という状況を考えなければいけません. そういった複数個のベクトルの相互関係や相互作用をどう定量するかといった内容 がこのセクションでのテーマになります. 上記の内容についてはベクトルの和・差で表すことができます. 複数のベクトルの扱いには和・差の他にも定数倍,内積,外積という三つの積があり,

    teddy-g
    teddy-g 2006/06/07
    ベクトルの内積を調べてて見つけた