どもっす。林岳彦です。さいきん軽い気持ちで某国際誌の総説論文の査読を引き受けたのですが、「どんな論文だろ?」と思いつつ査読対象の原稿をいざダウンロードしてみたら本文100頁アンド全体300頁もある超長尺の総説であることに気づき、「殺す気か!」「査読テロやで!」と思いました。 いやでもまじで300頁もレビューするの? この悲しみをどうすりゃいいの? 誰がぼくを救ってくれるの? この世はまさに大迷惑??? というかんじです。もう街のはずれでシュビドゥバーです。 いやもうホントに「レビュワー感謝の日」みたいの作ったほうが良いよね。 というわけで。 今回から、確率概念について説明していきたいと思います。 (今回も非常に長い記事になってしまいました。すみません。。。) 確率という概念の「規格」について、様相論理を経由して説明します 前回の今シリーズの概要説明の記事で書いたように、まずは、確率という概
あちょーhttps://t.co/qZD6UqzOKB #ねこ #猫動画 pic.twitter.com/yM462M7kiW — なぐ@naglly.comの中の人 (@naagle) November 25, 2024 猫の能力を過小評価した結果https://t.co/DEhGV5Xy8v #ねこ #猫動画 pic.twitter.com/HkjsV8pJQP — なぐ@naglly.comの中の人 (@naagle) November 25, 2024 本物はだれだ?https://t.co/LXLvSYtMaf #ねこ #猫動画 pic.twitter.com/S1QB6rpLAK — なぐ@naglly.comの中の人 (@naagle) November 26, 2024 いや...無理でしょhttps://t.co/dN5uOt2ysb #ねこ #猫動画 pic.twitt
「〜の変化は…でX割説明がつく」という言い回し - 発声練習 ピアソンの積率相関係数を割合や確率として扱うのは論外ではないかと思いますが、それは措いて、決定係数(寄与率)に関して、説明出来るとか説明がつくといった表現は、結構見るように思います。 そこで、手許にある統計の本を参照して、この用語がどのように解説されているかを引用してみます。自分の知識の整理にもなりますし。 尚、引用文中にある決定係数の数式は省略し、<数式>と書きます。 ※強調は原文のまま 工学・品質管理・実験計画系 F検定によって,有意性を検定するだけでなく,要因によるばらつきが,全体の変動Srのどのくらいを占めているかを調べることがある。それには,寄与率を求めればよい。 例えば,<数式> したがって,全体のばらつきの43.4%を成形温度という要因で説明できることがわかる。 谷津『すぐに役立つ実験の計画と解析 基礎編』(P56
1. 確率変数Xの分散V(X)は、Xの期待値をE(X)とすると、V(X) = E( (X - E(X) )^2)で定義される。 2. 言い換えれば、分散とは「「期待値からのずれ」の二乗」の期待値である。 3. 分散は、確率変数の値がどれだけ期待値からずれるかを表すもの(として定義したい)。 4. 期待値からのずれは大きくずれる場合と小さくずれる場合の二つがある。 5. 二乗しておけばどっちに転んでも大丈夫。 6. でも、絶対値を取ることにしてもいいよね。 7. いいけど、絶対値とる計算よりも二乗するほうが計算便利だし。 …と、ここまではいいと思うんですが、以下のA,Bも二乗する定義を採用する理由になるでしょうか? A. 分散に対して、等式 V(X) = E(X^2) - (E(X))^2 が成り立つ。 《分散は、平方の期待値から期待値の平方を引いた値になる》 B. 確率変数Xが期待値からず
3. 今回のもくじ イントロ -『相関と因果』再訪 基礎編 - 因果概念の変遷: 心の習慣 から 反事実 へ - 因果と確率論を繋ぐ:Pearlのdo演算子 実務編 - 重回帰とは因果構造分解酵素である - バックドア基準による変数選択 考察 - 因果推論の不可能性, モデル選択の3視点 4. 相関と因果は一致しない 86 女 性 84 の 平 82 均 寿 80 命 78 (歳) 30 34 38 NHKの放送受信契約数(百万) http://www.stat.go.jp/data/nihon/02.htm 元データ→ http://pid.nhk.or.jp/jushinryo/know/pdf/toukei2010.pdf 5. 相関と因果は一致しない 86 p < 0.00000002 女 2 性 84 R = 0.99 の 平 82 均 寿 80 命 78 (歳) 30 34 3
日本で8月に最もよく売れたWiley(Wiley-Blackwell, Wiley-VCHを含む)の理工書トップ5をご紹介します。タイトルまたは表紙画像をクリックすると、目次やサンプル章(Read an Excerpt)など、詳しい内容をご覧いただけます。 1位 Sequence Stratigraphy Edited by Dominic Emery, Keith Myers ISBN: 978-0-632-03706-3 Paperback / 304 pages / August 1996 地層学の有力な手法として近年急速に重要性を増した「シーケンス層序学」に関する古典的教科書です。British Petroleum (BP) で使われた研修用教材を基に編纂されたもので、シーケンス層序学の基本的な概念とテクニック、応用法を解説します。 2位 Advanced Analysis of
データ解析の重要性が認識されつつある(?)最近でさえも,A/Bテストを始めとしたテスト( = 統計的仮説検定:以後これをテストと呼ぶ)の重要性が注目される事は少なく,またテストの多くが正しく実施・解釈されていないという現状は今も昔も変わっていないように思われる。そこで,本シリーズではテストを正しく理解・実施・解釈してもらう事を目的として,テストのいろはをわかりやすく説明していきたいと思う。 スケジュール スケジュール 第1回 [読み物]:『人間の感覚のみでテスト結果を判定する事の難しさについて』:人間の感覚のみでは正しくテストの判定を行うのは困難である事を説明し,テストになぜ統計的手法が必要かを感じてもらう。 第2回 [読み物]:『「何をテストすべきか」意義のある仮説を立てるためのヒント』:何をテストするか,つまり改善可能性のある効果的な仮説を見いだす事は,テストの実施方法うんぬんより本質
研究者の多くはエラーバーの意味をろくに理解していない 今日、私は認知科学日記の読者がエラーバーをどれだけ理解しているかを問うオンライン投票を開始した――エラーバーとはよくグラフに乗っている、あの小さなI字型の、統計学の賜物である。正しく理解していないだろうということは、大体予想済みである。なぜそんなに自信があるかって? それは2005年、サラ・ベリア(Sarah Belia)らのチームが、最前線の心理学、神経科学、医学ジャーナルに論文を掲載したことがある数百人の研究者を対象に行った研究成果があるからである。彼らのうちエラーバーと有意さの関係について正しい知識を示したのはほんの一握りであった。論文を掲載した研究者たちができないなら、どうしてカジュアルなブログの読者ができることを前提としてよいだろうか? 信頼区間 まずそもそも、問題の解決法を知るため、少々の説明が必要である。信頼区間というコン
目次 1. 『コンプガチャの数理 -コンプに必要な期待回数の計算方法について-』 2. 『「数学的ゲームデザイン」というアプローチ』 3. 『コンプガチャの数理 -ガイドラインに基づいたゲームデザイン その1-』 4. 『コンプガチャの数理 -ガイドラインに基づいたゲームデザイン その2-』 目的 コンプガチャのコンプに必要な回数を求める問題は「The Coupon Collector's Problem」と呼ばれる数学モデルの枠組みに沿った美しい問題である事を述べ,いくつかの有用な結果を示す。 ※ あくまで個人研究のつもりで書いたので,色々不備があるかもしれません。その際は一言頂けると助かります。 定義 コンプガチャ問題を Coupon Collector's Problem に準じた形で書くと以下の様になる: 「全部で n 種類のアイテムがあって,1つのガチャの中にアイテムが1つ入って
について世上どのような考察がなされているか知りたいとふと思い、ぐぐってみたところ、このパワーポイントに行き当たった*1。書いたのはFrancois LevequeとLina Escobar。著者のうちLevequeはCERNA(Centre d'Economie Industrielle MINES ParisTech=パリ国立高等鉱業学校産業経済研究所)経済学部教授(HP)で、知財やエネルギー問題が専門で、EU Energy Policy Blogというブログに寄稿しているとの由。 そのパワーポイントの概要は以下の通り。 これまでに観測された炉心損傷事故は、14400年・炉数の中で、以下の11件*2。 Year Location Unit Reactor type 1959 California, USA Sodium reactor experiment Sodium-cooled p
伝えるための心理統計: 効果量・信頼区間・検定力 作者: 大久保街亜,岡田謙介出版社/メーカー: 勁草書房発売日: 2012/01/26メディア: 単行本購入: 9人 クリック: 164回この商品を含むブログ (13件) を見る先日コメント欄でYJSZKさんに教えて頂いた本です。書店に寄って、中身を確認してみました。 細かい評価は精読していないのでまたの機会にするとして、書の傾向・性質を考えれば、これぞまさに、私が「求めていた」本だと思います。 統計の勉強をしていて多くの人が悩む所として、 統計的検定の意義、「有意」とはどういう概念か、もし具体的な科学研究において「有意」となった場合に、どこまでの事が言えるのか。また、有意である事が、差の「大きさ」などの、科学において最も関心ある事柄について、一体どれくらいの情報を与えてくれるのか。 これらの事が挙げられると思います。 この種の疑問は、統計
前から思っていた事。放言です。 偏りの無い(6面の)サイコロを投げた時、それぞれの目が出る確率は1/6である。 この種の説明を見ていつも覚える違和感。 これは方向が逆で、 それぞれの目が出る確率が1/6であるサイコロを「偏りが無いサイコロと定義」する。 という事なんじゃないかと思ったり思わなかったり。 確率統計の説明って、現象を手がかりにして数理を理解させようとする工夫がよくありますが、それが逆にもの凄く解りにくくする場合も……という気がします。さっと流す人はいいかも知れませんが、私などは、この種の事に異様に拘ってしまうので…。つまり、「偏り」という概念と、数学的な「確率」の考え、そして、現実に存在する「サイコロ」という道具とをどのように結びつけるか。何故、「偏りが無い」という概念と「それぞれの目の出る確率が等しい」という事とが同じだと前提されているのか。みたいな所をいつも考えてしまいます
ほとんど、ちがやまるさん&YJSZKさん向けエントリー的。 でも、紹介する記述は、多くの人に参考になると思います。 前のエントリーで紹介した本で引用した文の続き。超大事な所なので、かなり長く引用します。※P270-272より引用。数学記号には、見えない時用に、括弧つけて別表現をします。(標本平均Xは「Xバー」とするなど)。強調+青文字装飾は、重要だと私が思った部分に施しました。 ビジネス統計学【上】 作者: アミール・アクゼル,ソウンデルパンディアン・ジャヤベル,鈴木一功,原田喜美枝,手嶋宣之出版社/メーカー: ダイヤモンド社発売日: 2007/03/16メディア: 単行本購入: 6人 クリック: 166回この商品を含むブログ (16件) を見る 中心極限定理によれば、平均がμ、標準偏差がσのどのような母集団であっても、数多くの無作為標本を選択すれば、その標本の平均X(Xバー)は(少なくと
『まどか☆マギカ』 まどかウエハースを140枚購入してカードをコンプリートしたスレ民・・・ | やらおん! 上記の記事を見るに、どうやら25枚のカードを手に入れるためにウェハースを140個開けたスレ民がウェハースの魔女に食べられたようなんだ。というよりもはや本人が絶望してウェハースの魔女になりかねない。むしろ俺なら魔女化する。それにしてもこのシャルのやつかわいいな。 もうすぐビックリマンシール(第1弾)も復刻されるとかされないやらで、人々の蒐集欲はどの時代もとどまることを知らない。ビックリマンシールは第1弾の37種類に新キャラが3種類増えて全部で40種類。全部で40枚だったら…うん、ダブリも考慮して60枚ぐらい買えばコンプリートできそう! そんな甘い考えだからひとはすぐに絶望しちゃうんだよ! コンプリートするために、どれだけの犠牲が必要なのか。さて、ここからちょっと算数の時間。苦手なひとや
「95%信頼区間とは,真の値が入る確率が95%の区間のことです」というような説明をすることがあります。私も,一般のかたに説明するときは,ついそのように言ってしまうことがあります。でも本当は真っ赤なウソです。主観確率を扱うベイズ統計学はここでは考えません。 正規分布では,ウソの考え方をしても結論が同じになることがあるので,ここではわざと,左右非対称なポアソン分布を考えます。 ポアソン分布とは,1日に起こる地震の数,1時間に窓口を訪れるお客の数,1分間に測定器に当たる放射線の数などを表す分布です。平均 $\lambda$ のポアソン分布の確率分布は次の式で表されます: \[ p_k = \frac{\lambda^k e^{-\lambda}}{k!} \] $\lambda = 10$ のポアソン分布の確率分布をグラフにすると次のようになります(本当は右に無限に延びるのですが,$k = 30
「ランダムに事象が起きる」という考え方 次の図は1200秒間に初代ポケットガイガー(PINフォトダイオードを使った放射線計)が放射線をカウントした時刻を示したものです。下は机の上にそのまま置いた場合(全部で17カウント),上はやさしお(カリウムを多く含む塩)の上に置いた場合(全部で38カウント)です。 par(mgp=c(2,0.8,0)) plot(c(0,1200), c(0,3), type="n", axes=FALSE, xlab="", ylab="") axis(1) x1 = c(55,81.5,178.1,194.4,214.3,254.3,517.8,548.7, 553.6,556.6,700.1,730.7,735.6,881.9,883.3,962.2,1164.2) x2 = c(43.9,54.8,85,94.3,115.2,224.5,228.5,246.1
1998 年情報論的学習理論ワークショップ 1998 Workshop on Information-Based Induction Sciences (IBIS'98) Hakone, Japan, July 11-12, 1998. Model Selection and Related Topics in Statistical Sciences 伊庭 幸人 Yukito Iba モデル選択とその周辺 Abstract: There are a number of statistical methodologies, each of which has its own philosophy and mathematical background. A way to understand them is to regard them as tools for de ning
本編の方はフィデューシャル推測の項まで書いたのでもう良いかなあ、と思って終わりにして、今回から同書の「素晴らしすぎる訳者解説」のメモを書いていきます。 訳者の方は「渋谷政昭・竹内啓」さんなのですが、巻末の訳者解説が本当に素晴らしく完成度が高いのです。「池上彰か!」とツッコミたくなるくらいその解説は分かりやすく明確です。 こんな素晴らしい解説文が絶版により埋もれてしまうのは大きな文化的損失ですので、本来ならば全文引用したいところですが、色々な事情もありますので、フィデューシャル推測に関する部分だけを引用していきます。とはいっても長いので何回かに分けて見ていきます(かなり長丁場のシリーズになるかもしれません)。 同書201pの第3節の部分から引用していきます: 統計的推測の問題をはっきりさせるために、一つの例をあげて説明しよう。 今あるものの長さを測って、75.8cm、75.9cm、75.2c
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く