大学教育の質の保証・向上ならびに 電子化及びオープンアクセスの推進の観点から 学校教育法第百十三条に基づき、 教育研究活動の状況を公表しています。
第百十三条 大学は、教育研究の成果の普及及び活用の促進に資するため、その教育研究活動の状況を公表するものとする。
A.【講義の再話】 測定ではさまざまな「差」があり、以下のようなものが挙げられる。 ・誤差:真の値とデータの差 ・偏差:平均値とデータの差 ・公差:理想の値(スペック値)とデータの差 などがある。また、値の現れた回数を全体の試行回数で割ると確率が導出できる。 連続確率分布は、ヒストグラムなどの離散的な値を近似して連続的な分布にして表したものであり、特に確率の場合は分布関数という、0を最小、1を最大としたような分布が用いられる。この時、母平均は確率分布に従う確率変数の期待値と取ることができる。有名な分布として、正規分布がある。 【発表の要旨】 Pythonのコードを用いてヒストグラムを描いた。母数が少ない場合は両端が高くなる等正規分布に近い形にならなかったが、母数を増やすにつれ正規分布に近い形になっていくことが実際にヒストグラムを書いてわかった。 Writing ? review & editing 【復習の内容】 正規分布を用いた有名な例として、選挙速報における「当選確実」が挙げられる。選挙ほど多数の票が入る場合はほぼ確実に正規分布に従うと言え、開票数パーセントで当選が確実と言えるのである。
A.①確率、偏差、公差、誤差、平均、正規分布など数学的な話を学んだ。 ②20歳日本人男性の平均体重が57.0kg、標準偏差8.8のときの正規乱数のヒストグラムをn数を変えて書いた。 ③確率密度関数とは、連続的な確率変数が特定の値をとる確率の分布を表す関数である。この関数の値そのものが確率ではなく、ある範囲の確率は関数をその範囲で積分することで求められる。全体の面積(積分値)は1となり、代表的な例に正規分布などがある。確率の分布の様子を視覚的・数学的に理解するために用いられる。
A.①まずは、10円玉と1円玉を使い回路を作って電位差を求めた。この値のずれから、偶然誤差:反復測定において、予測が不可能な変化をする測定誤差の成分、系統誤差:反復測定において、一定のままであるかまたは、予測可能な変化をする測定誤差の成分のことである。また、誤差とは真の値からのずれであり、偏差は平均との差である。 さらに、ヒトが決めた値とのずれのことを、公差という。 これらをまとめてグラフにしたものをヒストグラム、分布関数、確率密度関数など様々なグラフ、関数を用いて表現する。 ②Pythonコードを用いてヒストグラムを作成した。母数や、平均の数を変化させると目に見えてグラフの形が変わることが分かった。 ③Maxwell-Boltzmann分布とは、統計力学の基礎的な考え方の1つで、平衡状態において理想気体分子の各速度についての確率分布を表す関数である。 熱力学的にみられる演繹的な立場をとると、この理想状態はより巨視的な、平衡状態における各状態のエネルギー量についての存在確率分布の関数とも読み替えられる。
A. この授業では、11円電池を使った数値のばらつきについて学んだ。11円電池は、1円玉と10円玉硬貨でできる電池で、1円玉硬貨のアルミニウムをと円玉硬貨の銅が電極となる電池である。この電池では、AD変換された数値が直接表示されるため、数値にばらつきが生じる。 発表の要旨では、正規乱数のヒストグラムについて調べ、それを書いた。今回では20歳男性の平均体重について調べた。20歳男性の平均体重は57.0㎏であり、標準偏差で表すと、8.8となった。そしてこのデータをもとにヒストグラムをかいた。 復習では、誤差、偏差、公差の違いについて調べた。誤差とは測定値と真の値の差のことである。偏差は、個々のデータがどれだけ平均値から離れているかを示す値である。公差は、設計において許容される寸法に範囲を指す。
A. 公差とは使用値と測定値との差で、偏差とは代表値と測定値との差である。代表値として何を選ぶかによって偏差は変わる。ヒストグラムと確率密度関数とはデータ分布を可視化する手法で、連続分布では累積分布関数と確率密度関数が使われる。また、母平均と標本平均というものがあり、母平均は母集団全体の平均を指し、標本平均は母集団からサンプリングされた標本の平均を指す。 グループワークでは正規乱数のヒストグラムを描いた。母平均52.2、母標準偏差9.5として、母数を10、100、1000と変えて正規乱数のヒストグラムを計算した。母数が10ではグラフがヒストグラムらしくなく、グラフから得られる情報がなかった。母数が100になると、情報の傾向がわかりやすくなっていたが、今回は飛値があった。母数が1000になると、情報の傾向がかなりわかりやすく表れていた。 事後学習では誤差・公差・偏差の違いについて考えた。誤差とは、真の値と測定や計測によって得られる値との差を指す。偏差とは、個々のデータの値とそのデータの代表値との差を指す。交差とは、設計において部品の寸法や形状、位置などが許容される変動範囲のことを指す。
A.【講義の再話】 例えば電池を設計する場合スペック(仕様)を0.5Vに設定したとする。測定値が0.529Vだとすると0.029Vの差があることになる。このように人が決めた値との差のことを交差という。(真の値との差:誤差、平均値からの差:偏差) 確率とは出現回数を全回数で割れば求められる。ヒストグラムとはある範囲を決めてその範囲に入っている数値の数をグラフに表して可視化したものである。 連続分布について、確率変数(さいころの目が出るはそれぞれ確率1/6など)がある値xより小さい値を与える確率をxの関数F(x)とおくと確率分布を表すことができる。この関数F(x)を分布関数という。縦軸に分布関数、横軸にxを取ると分布関数は0から1までの範囲で変化する単調増加関数(右から上がり)であることがわかる。 x軸に分子の速度、y軸に存在確率をとったグラフ(山なり)はマクスウェルボルツマン分布として知られているがこれを積分すると単調増加関数(右肩上がり)のグラフとなる。(山の頂点は平均速度、そこに軸を引き、この軸との差が標準偏差) 確率分布において確率変数の期待値を平均値として定義する(82ページ)。平均には母平均と標本平均がある。8回目の授業で3つの電位を測って出した平均値は標本平均である。なぜならこの場合母平均を求めようとしたら無限に測定できるからである。このように母集団が無限にあったりして母平均を求めるのが難しい場合、標本平均を用いる。(全人口など母集団の値が明確に決まっている場合は母平均を出すことも可能) 標本平均との差は標本標準偏差で表すことができる。(母平均との差を表したものは母標準偏差) 【発表の要旨】 演題 正規乱数のヒストグラムを描こう グループ名 ヒス 役割 責任著者 共著者 鈴木結惟、原野未優、高橋香桃花、三船歩美 母集団の値を変えると縦軸のみ変化し、グラフの形自体は変わらなかった。 標準偏差を変えると横軸のみが変化し、グラフの形は変わらなかった。 一方、平均値を変えるとグラフの形が変化した。 【復習の内容】 トピック名 誤差、偏差、公差の違いについて考えよう。 例えば電池を設計する場合スペック(仕様)を0.5Vに設定したとする。測定値が0.529Vだとすると0.029Vの差があることになる。このように人が決めた値との差のことを交差という。(真の値との差:誤差、平均値からの誤差:偏差)
A. 正規乱数のヒストグラムは、母数(サンプルサイズ)によって形が変化する。母数が大きいほど、ヒストグ ラムは理論的な正規分布に近づく。例えば、母数が 10000 の場合、ヒストグラムは滑らかで左右対称な形状を 示し、平均値付近にデータが集中する。一方、母数が 1000 の場合でも同様に正規分布に近い形状が示されるが、 若干のばらつきが見られる。 母数が 100 や 10 の場合、ヒストグラムの形状はより不規則になる。母数が 100 の場合、データのばらつきが 増え、正規分布の形状が崩れることがある。母数が 10 の場合、ヒストグラムは非常に不規則で、平均値付近に データが集中する傾向が弱くなる。このように、母数が小さいほど、ヒストグラムは理論的な正規分布から逸 脱しやすくなる。 結論として、母数が大きいほぼヒストグラムは理論的な正規分布に近づき、データのばらつきが少なくなる。 逆に、母数が小さい場合、ヒストグラムは不規則で、正規分布の形状から逸脱しやすくなる。
A.①真の値は人間には知ることができず、測定で得られる値はあくまで推定にすぎない。そして、測定値と真の値との差は誤差と呼ばれ、平均値もまた推定値の一つである。また、人が定めた基準からのズレは公差といい、品質の許容範囲を示す。 測定値のばらつきは確率分布として表され、ある値以下になる確率を示す関数が累積分布関数(F(x))である。F(x)は0から1の間で増加し、F(x)が下側確率、1-F(x)が上側確率となる。さらに、測定値と代表値との差を偏差といい、代表値に平均を用いれば偏差の合計は0となる。ただし、代表値のとり方によって偏差の意味は変わってくることに注意が必要である。 今回のグループワークは、正規乱数のヒストグラムを描こうである。 ②演題は正規乱数のヒストグラムを描こうであり、グループ名は名無し、属した人は、平方誠二郎、三好駿斗、鈴木奏逞、須藤春翔、であり、役割は調査係。 pythonコードを入力し、正規乱数のヒストグラムを描く事ができた。また、ヒストグラムの外形を紙に書いた。 ③私は、代表値の選び方によって、データの見え方や解釈がどのように変わるのか調べた。 まず、平均値は全体の傾向を示すが、極端な値に左右されやすいという特徴がある。次に、中央値はデータの中心を示しているため、外れ値の影響を受けにくいという特徴がある。一方、最頻値は最も多く現れる値で、よくあるパターンを把握するのに有効であると考えられる。 これらの事から、どの代表値を使うかによって、判断や意思決定の方向性が変わるため、目的に応じて適切な代表値を選ぶことが重要であると感じた。
A.
A.①統計学では正規分布というものが広く使われる。化学系のみなさんだと粒子径分布や積算分布で見たことがあるかもしれない。測定値にはほぼ必ず真値との誤差が生じる。誤差には系統誤差と偶然誤差がある。系統誤差とは反復測定おいて一定のままであるか、または予測可能な変化をする測定誤差の成分である。一方、偶然誤差は予測が不可能な変化をする測定誤差のコトである。 ②「正規乱数のヒストグラムを描こう」グループ名:いろはす、佐々木、長橋、久保、役割:可視化 母数を変化させて正規乱数がどのように推移するか確かめた。母数が10のときは凹のような形のヒストグラムができあがりとても正規分布とは言えない。100にすると少し中央が山になったヒストグラムができあがり、1000にするとピークが広めの正規分布のヒストグラムができあがった。母数が多ければより正規分布に近づくことが確認できた。 ③ 誤差とは測定値と真値の差のことである。誤差の許容範囲を公差という。公差は測定値の精度を表す指標にもなっている。偏差は平均値との差を表している。
A.① 講義の内容 母平均と標本平均、偏差について学びました。母平均とは母集団をある確率分布で表したときその確率分布に従う確率変数の期待値のことでμ=E[x]で表される。母平均は母集団を代表する値として用いられるまた、標準平均はある母集団から標本が採取されたとき母平均の推移定量として使用される。また偏差とは測定値と代表値の差のことをいい、偏差が0になるときの代表値は平均値になる。またヒストグラムに表す方法を学んだ。 ② 発表の要旨 日本男児7歳の体重をPythonを使ってヒストグラムに表しました。標準偏差は5.8、母数は28、平均24.7でした。ヒストグラムは、データの分布を視覚的に表す棒グラフです。横軸に階級(データの範囲)、縦軸に度数(出現回数)をとり、データの偏りやばらつきを把握できます。h ③ 復習の内容 偶然誤差とは反復測定において、予測が不可能な変化をする測定誤差の成分のことをいう。系統誤差とは反復測定において、一定のままであるかまたは予測可能な変化をする測定誤差の成分をいう。再現性とは測定の再現条件下での測定の精密さをいう。精密さは精度のことでばらつきの小ささを表す。精確さは確度を表す。
A. スペックが0.5Vで実際に測定した値が0.529Vであった場合、公差は仕様値と測定値との差であるため、0.029Vとなる。測定に関する用語として、公差は仕様とのズレ、誤差は真の値との差、偏差は測定値と平均値などの代表値との差を指す。統計の分野では、確率変数がある値x以下である確率をF(x)として表し、これを累積分布関数(CDF)と呼ぶ。CDFは常に0から1の間で変化する単調増加関数であり、F(x)は「下側確率」、1-F(x)は「上側確率」と呼ばれる。母集団全体に関する平均を母平均、分散や標準偏差を母分散・母標準偏差といい、これらは母数と呼ばれ、有限である必要がある。一方、標本調査において得られる標本平均や標本標準偏差は、理論上無限に測定可能とされる。これらの概念は、品質管理や工程管理、製品の精度評価などにおいて非常に重要であり、統計的手法を用いることで測定値の信頼性やばらつきを定量的に評価できる。 今回のグループワークで与えられたグラフのデータの数値を変更した。縦軸のみ変化し、グラフ事態の形に変化は見られなかった。平均を変えると形も変形した。 CFDについて詳しく調べた。CFDでは、流体の動きを支配するナビエ?ストークス方程式などの微分方程式を数値的に解いて、流速・圧力・温度・密度などの分布を計算する。主な用途は飛行機や車の空気抵抗の計算であり、実験に比べてコストが安いというメリットがある。
A.今回の授業では前回測定した1円玉に対する10円玉の電位の誤差について偏差などを考えました。誤差とは真の値と測定値との差で、公差とは仕様の値との差でした。母平均とは、母集団全体の平均であり、標本平均とは母集団から選んだ数字の平均でした。また、連続分布についても学び、分布関数と確率密度関数があると分かりました。 また、グループワークではPythonを使用し男子1歳の体重と身長についてヒストグラムを作りました。平均体重は10.3kgで、偏差は1.4でした。身長のヒストグラムにはばらつきがあるが、体重に関してはばらつきがあまりないということが分かりました。また、Pythonを使用することがないので使い方を学べました。 偏差とは各データが平均値からどれだけずれているかをあらわすもので、偏差値とはテストの点数などで使う平均50標準偏差10に正規化したスコアのことです。
A.①誤差、偏差、公差、ヒストグラム、連続分布、標本平均から母平均の推定などを学びました。誤差は「測定値―真値」、偏差は平均値からの差(ずれ)、公差は人が決めた値(指定値)からのずれを意味していました。ヒストグラムは、同じ数値が何個あるかを数え、グラフで表したもので、正しい工程での測定が繰り返されるとほぼ左右対称の山ができ、平均値、最頻値、中央値が一致することが分かりました。連続分布には分布関数(積算型)と確率密度関数があり、分布関数を微分すると確率密度関数に、確率密度関数を積分すると分布関数の形に変換できることが分かりました。連続分布の2つのグラフが使われている代表例として、マクスウェル分布がありました。また、母平均の数が非常に多い場合は、標本集団を一部サンプリングして、その標本平均から母平均を推定する方法があることを知りました。 ②グループ名は一番前です。グループメンバーは小野翔太、畑中勝浩、前田悠斗です。発表では、正規分布のヒストグラムを描きました。Pythonでそれぞれ母平均を52.2、母標準偏差を9.5、母数を1000として入力して、ヒストグラムに変換しました。この際、それぞれの入力した値が母集団に関する値であることを間違えないように意識しました。ヒストグラムは山が右側に傾いていました。正しい工程での測定が繰り返されるとほぼ左右対称になるはずなので、工程があまり妥当でなかったのではないかという意見が出ました。 ③復習ではマクスウェル分布について調べました。マクスウェル分布は、気体分子の速度分布を表す統計分布で、分子運動論や熱力学で重要な役割を果たしていることが分かりました。とくに理想気体における粒子の速度やエネルギーの広がりを記述するのに使われていました。グラフは分布関数に従い、横軸には速度、縦軸には確率をとっており、それぞれの速度を持つ気体分子の割合が視覚的に確認できます。
A. 第9回の講義では、測定の誤差や確率論について理解を深めた。誤差と似た言葉に公差と偏差がある。それぞれの意味について、誤差は測定値と真の値とのズレを、公差は製品に許容される寸法や性能のズの範囲を、偏差は平均値や基準値からのズレを表す。これらを正確に使い分けることが大切だと学んだ。また、ヒストグラムと対応する分布関数と確率密度分布について触れ、そのグラフの外形や表す意味について新たに知ることができた。 グループディスカッションでは、「演題:正規乱数のヒストグラムを描こう(グループ名:ありさこ、共著者名:近ありす、石垣彩奈、山崎里歩、役割:発言者)」について話し合いを行った。私たちは、日本男児7歳の体重について、データをヒストグラムに起こした。今回使用したデータは、母数28人、平均24.7kg、標準偏差5,8であり、そのヒストグラムは正規分布とは異なり若干ばらつきが目立つような形状となった。このヒストグラムから、3分の2ほどの人が25kgより軽い範囲に集中していると分かる。したがって、頻度分布曲線は極大が少し左側に寄った凸の形になると考えられる。また、分布関数は増加傾向がより早く表れるような形状になると考えられる。 発展内容として、気体分子の速度分布について調べた。調査の結果、これは主にマクスウェル・ボルツマン分布により説明できることが分かった。この分布曲線は気体中の分子の運動速度が一様でなく、どのような割合で存在しているかを表している。また、これは温度に依存し、高温になるほどグラフのピークは右に、極大は低い位置に変化していく様子が見られる。マクスウェル・ボルツマン分布を用いれば、平均速度、二乗平均速度、最確速度といった期待値を導き出せるということも分かった。これは化学反応の解析などに応用されることも、この調査で明らかになった。
A.人が定めた基準値と真の値との差を交差と言うが、それに対して、偏差はデータの各値と平均が0になるようにとられた代表値との差のことである。確率変数とはランダムな出来事の結果を数値で表すものであり、その確率変数がどの値を取るかを確率で示したものが確率分布である。これらを表にしたものがヒストグラムであり、データをより増やすとそのヒストグラムの形は確率分布に近づく。 日本男児の1歳の体重のヒストグラムを作成した。この時、母数は10人の時と、100人の時とで調べ、平均は10.3kg、標準偏差は1.4であった。ヒストグラムの形は、母数が10人の時ばらつきがあり、まとまりのない形となったが、母数が100人になると概ね山なりの形が見られるようになった。 復習として離散確率分布と連続確率分布について調べた。
A.今回の授業では誤差についての話が印象に残りました。測定者個人によって発生する個人誤差、一定条件化で同じ方向に同じだけ発生する系統誤差、原因を特定できない偶然誤差の3つについて知ることができました。 今回の発表ではヒストグラムを作成しました。実際にヒストグラムを書いてみて正規分布曲線と同じような形になることがわかりました。 ヒストグラムがどんな場面で使われているか調べました。顧客分析、マーケティング、アンケート調査などで利用されていることがわかりました。マーケティングで利用されていると知って少し驚きました。
A.1.まずは、10円玉と1円玉を使い回路を作って電位差を求めた。この値のずれから、偶然誤差:反復測定において、予測が不可能な変化をする測定誤差の成分、系統誤差:反復測定において、一定のままであるかまたは、予測可能な変化をする測定誤差の成分のことである。また、誤差とは真の値からのずれであり、偏差は平均との差である。 さらに、ヒトが決めた値(スペック)とのずれのことを、公差という。 これらをまとめてグラフにしたものをヒストグラム、分布関数、確率密度関数など様々なグラフ、関数を用いて表現する。 2.私たちのグループでは、グループ名を一番前とし、Pythonコードを用いてヒストグラムを作成した。母数や、平均の数を変化させると目に見えてグラフの形が変わることが分かった。 3.Maxwell-Boltzmann分布とは、統計力学の基礎的な考え方の1つで、平衡状態において理想気体分子の各速度についての確率分布を表す関数である。 熱力学的にみられる演繹的な立場をとると、この理想状態はより巨視的な、平衡状態における各状態のエネルギー量についての(各状態の)存在確率分布の関数とも読み替えられる。
A.①ヒストグラムとは、量的データの分布状況を視覚的に把握するためのグラフである。データをいくつかの区間に分け、それぞれの区間に含まれるデータの個数(度数)を棒グラフで表し、棒グラフの高さが度数を表し、横軸がデータの区間(階級)を表す。母標準偏差とは母集団からとった値を指し、標本標準偏差は標本からとった値を指す。 ②発表では、1歳男児の体重の平均について調査した。平均体重は10.3kg、票差は1.4である。これらを用いてヒストグラムに表し、視覚的にわかりやすくした。 ③復習では、公差と誤差について詳しく調査した。誤差は、測定値と真の値の差を表し、公差は、許容できる誤差の範囲を指す。誤差は、測定機器の精度、測定者の技術、環境条件など、様々な要因によって発生する。公差は、製品の機能や品質を維持するために、設計段階で定められる。公差を設定することで、製造コストを抑えつつ、必要な品質を確保することができる。
A. 公差とは仕様との値の差であるが、誤差というのは真の値と測定値の差である。また、めったにないことを確率が小さいという。何らかのデータをとって、平均値を求めたとするとそれは推定値というものに分類される。加えて、偏差とは測定値と代表値の差の1つであり、代表値は平均値の1つである。いくつかの測定値を得て、そこから偏差を求めたとする。すべての偏差を足し合わせると0となる。 また、グループワークではPythonを使用し男子1歳の体重と身長についてヒストグラムを作りました。平均体重は10.3kgで、偏差は1.4でした。身長のヒストグラムにはばらつきがあるが、体重に関してはばらつきがあまりないということが分かりました。また、Pythonを使用することがないので使い方を学べました。 実際にミニトマト10個の重さを計測し、データを集めた。平均値は以下のように求められた。 x ?=(データの和)/(データの数) =(12.1+11.8+12.3+12.0+11.9+12.2+12.4+11.7+12.0+12.1)/10=12.05=12.1[g] また、偏差は次のように求められた。 s=(各値と平均値の差を二乗した値の和)/(データの数) =[0.052+(-0.25)2+0.252+(-0.05)2+(-0.15)2+0.152+0.352+(-0.35)2+0.052+(-0.05)2]/10 =0.0425 であった。
A.①まず値について学んだ。真の値は人が知りえないものである。測って得られた平均値は推定値であり、平均値との差は偏差という。仕様を0.5Vにし、差は0.029となった。これは人が決めた値とのずれなので公差という。よって誤差は神のみぞ知るものであり、人は求められないものだとわかる。次に確立について考えた。めったにないことは確率が小さいという。確率は狙った事象がでる回数を全体で割った値である。次に平均について考える。母平均は母集団を確率分布で表したとき、その確率分布にしたとき、その確率分布に従う確率変数の期待値をその母集団の母平均と呼ぶ。また、それ以上である値をとる確率とそれより小さい値となる確率がちょうど50%になるような値であるメディアン(中央値)がある。 ②グループワークでは1歳の男子の日本人の体重を文献値より探した。平均体重は10.3kgであり、標準偏差は1.4であった。母数が10のときと100の時で得られた世紀乱数のヒストグラムをそれぞれ記入した。母数が多い100のヒストグラムの方が正規の値により近くなるため正しいグラフであると考えた。母数が100の方が平均値の値に多く標本が集まっていることがわかる。 ③メディアン(中央値)の使用例について考えた。中央値を出すことでデータの中心的な値を示すことができ、外れ値の影響を受けにくい特徴を持つ。使用例としては所得分布の分析などに使われる。所得分布の分析として平均分布は一部の高齢者に引っ張られてしまうため中央値を求めることで影響を受けずに一般的な所得層を数字で見ることができる。例として国民の中央値年収として使われる。このように日常的な中でも外れ値の影響を受けない中央値は使用されているとわかった。
A. 根本的に誤差と偏差は異なるということや、その集計を行うためのヒストグラムには分布関数や確率密度関数が関係していること、平均やモード、メディアンとの関係には標本平均と母平均を用いるということを学んだ。特に分布関数ではCDF、累積分布関数、確率密度関数にはマクスウェルーボルツマン分布があるということを学んだ。 発表では、正規乱数のヒストグラムを標本数を変化させてグラフを描いた。自分たちのチームでは標本数を1000と10000の2つについてのグラフを発表した。 復習ではマクスウェル=ボルツマン分布について考えた。マクスウェル=ボルツマン分布とは、気体中の分子の速度やエネルギーがどのように分布しているかを示す確率分布で、特に理想気体における分子運動論の基本として使われる。他の関連する分布との違いとして、フェルミ=ディラック分布は、電子などのフェルミ粒子に用いて、パウリの排他原理という特徴がある。また、ボーズ=アインシュタイン分布では、光子や中性子などのボース粒子が主な用途であり、同じ状態に多数が共存可能という特徴がある。
A. ある確立した確率の下で、偶然的に表れる変数を確率変数といい、確率変数がどのような確率で現れるのかを表現したものを確率分布といいます。確率分布には、個別の値をとる離散確率分布と連続的な値をとる連続確率分布の2種類があります。実数で表される連続確率分布には、ある特定の値以下の確率を示す分布関数と連続確率変数の分布を表す確率密度関数が存在します。分布関数では直接的に確率を求めるのに対し、確率密度関数では特定の区間を積分することにより確率を求めます。 演題は「正規乱数のヒストグラムを描こう」で、グループ名はありさこです。共同著者は、近ありす・立花小春・山崎里歩です。私は発言の役割を果たしました。私達のグループは、日本男児の7才の体重を選び、ヒストグラムに表しました。参照したサイトより、平均値は24.7㎏、母数は28人、標準偏差は5.8㎏であることが分かりました。ヒストグラムでは、横軸に体重、縦軸に人数を取りました。その結果、23?25㎏あたりで最頻値をとることが分かりました。また、平均値より低い体重の児童が多く、左側に分布が偏っていることが分かりました。 本授業で、母集団をある確率分布で表したとき、その分布の期待値である母平均について学びました。母平均は、確率質量関数や確率密度関数が分からないときには求めることができません。しかし、標本がある場合にはその値を推定することができます。母平均を推定する際には、標本のランダム性や標本数の多さが大切になるのではないかと考えました。
A.①今回の講義では、偏差について学んだ。電池の設計において、スペックや仕様は人が決めた値であり、その値との差は公差という。また、ヒストグラムから下側確率と上側確率について学んだ。続いて分子の存在確率から、分子の速度のグラフについて調査し、ボルツマン関数について学んだ。また、教科書より、確率密度関数と平均について調査した。期待値を平均値とよぶことが多く、母集団をある確率分布で表したとき、その確率分布に従う確率変数の期待値をその母集団の母平均という。標本平均とは、標本から求まる平均である。また、連続と離散では求める式が変わる。また、母平均と標本平均について学んだ。母数が有限であることがわかっている場合のみ、母平均を使い、基本的には標本平均を使うことを学んだ。 ② 発表では1歳の日本人男女の身長のと標準偏差から有意差検定を行った。ヒストグラムの形から女は男の図を左にずらしたような値を取ったため、これらは、統計的に意味を有する差であると考えた。 ③今回の授業ではデータのばらつきについて学んだ。真の値は人が知り得ない値であり、測って得られた平均値は測定値である。平均値との差は偏差と言う。人が決めた値とのズレのことを公差と言う。確率は、狙った事象が出る回数を全体で割った値である。また教科書より確率密度関数と平均、メディアン、モードの関数を表す一例を調べた。また母集団の母平均やメディアン(中央値)などについても学んだ。
A. 偏差とは測定値と代表値との差(引き算)を表す。平均値は代表値の一つである。 公差とは、加工や工業において避けられない誤差に対して、許容される数値の範囲を示したものである。滅多にないことを確率が小さいという。 各範囲内にある割合を頻度分布といい、それをヒストグラムで表すことができる。ヒストグラムの頂部を曲線で結んだものを頻度分布曲線という。 分布関数とは、確率変数がある値xより小さい値である確率をxの関数F(x)のことである。分布関数は0から1までの範囲で変化する単調増加関数である。xに近い値がどれだけ現れやすいか知る目的の指標にはならない。確率密度関数はP(x)で示すことができる。連続的な確率変数の確立分布を表す。確率密度関数(微分)から、分布関数(積分)を推定できる。 確率密度関数から期待値E[x](平均値)を求めることができる。母平均とは、母集団をある確率分布で表した時、その確率分布に従う確率変数の期待値をその母集団の母平均という。母平均を求めるには、測定を無限に行わないといけない。標本平均とは、ある母集団から無作為に抽出された標本を使ったものである。
A.【講義の再話】 ヒストグラムについて学んだ。ある値の範囲を決め、その範囲にある値の数を棒グラフにして表したものである。その為、離散的な確率であるといえる。分布関数と確率密度関数についても学んだ。これらは連続的な確率であるといえる。分布関数とは確率変数がある値xより小さい値である確率を関数F(x)で表現しているものである。また、確率密度関数とはp(x)であらわされる、連続的な確率変数の確率分布を表す方法の一つであり、これを-∞からxまで微分したものが確率の意味を持つ。また、実測値は必ず離散数であるので、基本的に微分することができない。加えて、縦軸がp(x)横軸がx m/sになるマクスウェルーボルツマン分布についても調べた。分布関数と同じ形のグラフで表すことができた。 【発表の要旨】 演題は正規乱数のヒストグラムを書こうであり、グループ名はヒスであった。グループに属した人は高橋香桃花、原野美優、三船歩美、鈴木結唯、増子香奈であった。正規乱数のヒストグラムをパイソンを用いて書いた。私は調査係としてパイソンにコードを入れ、その中の数値を変化させてヒストグラムの形の変化を調査した。結果縦軸は変化したが、グラフの形自体は変化しなかった。しかし、平均を変化させたときは形も変化した。 【復習の内容】 母平均と標本平均について調べた。母平均とは母集団全体の平均で標本平均は母集団から取り出した一部の標本の平均であることがわかった。前回計測した10円の電位の測定値は、標本平均である。この場合何回でも電位を測定できるので母集団の数は無限であるためである。また、標準偏差も母集団からとると母標準偏差、標本から採ると標本標準偏差となる。
A.
A.誤差 測定値や計算値が真の値からどれだけずれているかを示す量 偏差 個々の数値と平均値との差のこと 公差 製品の寸法や形状において、許容される誤差の範囲 めったにない=確率が小さい(出現回数を全回数で割る) ヒストグラム 対象のデータを区間ごとに区切った度数分布表を、棒グラフに似た図で表現したグラフのこと 離散的な値と言える 例)化学工学p330 図11-2,11-3 p232 図7-4 一方、実数で表される連続的な確率変数に対する確率分布を連続分布、連続確率分布と呼ぶ。 連続分布においては、確率変数がある値xより小さい値である確率をxの関数F(x)として与えることで確率分布を表現することができる。 この関数f(x)を分布関数あるいは累積分布関数と呼ぶ。分布関数の一例をp80図4.1(a)に示されている。 この図に示すように、分布関数は0から1 までの範囲で変化する単調増加関数である。 分布関数が与える値F(x) をxに対する下側確率 値1-F(x)をxに対する上側確率と呼ぶ。 マクスウェルボルツマン関数 分布関数を求めることができた。平均はどうやって求めたら良いか? 計量p83 図4.3 確率密度関数と平均 確率分布の代表値として用いられる値の一つに、確率変数の期待値がある。具体的に離散的な確率変数と連続的な確率変数に分けて期待値を説明する。 連続的な確率変数の期待値E[x]は、確率密度関数p(x)を用いて以下のように定義する。 E[x] = integrate xp(x) dx from - ∞ to ∞ (4.5) ただし、p(x)が実数全域で定義されていない場合は、その定義域で積分する。 母集団をある確率分布で表したとき、その確率分布に従う確率変数の期待値をその母集団の母平均と呼ぶ。つまり、母平均を以下のように定義する。 μ=Ε[x] (4.6) 母平均は母集団を代表する値としてよく用いられる。 母平均は、確率質量関数P(x)や確率密度関数p(x)がわからないときには求めることはできない。しかし、標本がある場合には、その値を推定することができる。ある母集団から採取された標本。があるとする。母平均の推定量としては、以下のx-がよく用いられる。 (4.7) xは標本から求まる平均であり、標本平均(試料平均、サンプル平均)と呼ぶ。 標本の個数が非常に大きければ、標本平均は母平均に近い値になる。 母平均とは、母集団(全体の集団)の平均を指し、標本平均は、母集団から抽出した一部の集団(標本)の平均を指します。簡単に言うと、母平均は全体の結果を反映し、標本平均は一部の結果を表すという違いがあります。 三つの値からその平均を求めた値は母平均といえる。 ただし、測定に限りがなく、母集団が無限にあると考えると、三回の測定の平均値0.539は標本平均ということになる。 母標準偏差:母集団の確率分布に従う確率変数の分散および標準偏差を母分散および母標準偏差と呼ぶ。 母平均と同じく、母分散も確率質量関数P(x)や確率密度関数p(x)がわからないときには求めることはできないが、標本から推定することはできる。 標本標準偏差:母標準偏差の推定量として用いられる。標本データから母集団の標準偏差を推定するために用いられる統計量です。標本分散の平方根で表され、標本データのばらつきを表します。? ウェブクラスのPythonで実行してみよう 確率密度関数→分布関数→ヒストグラム
A. 確率分布について学んだ。連続分布は実数で表せられる連続的な確率変数についての確率分布である。連続分布において、確率変数がある値xより小さい値である確率をxの関数F(x)として与えることで確率分布を表現することができ、これを分布関数という。確率密度関数はΔFをxで除して、Δxが0の極限の時のこの値、F(x)の微分である。また、確率変数の期待値を母集団の母平均という。1円を実際に測ったときの測定値は標本平均である。母数は無限にあり、すべて測ることはできないため標本平均である。母集団どうしは大きすぎて比較できない。標準偏差は確率分布の広がりを示す指標であり、標本からとると標本標準偏差、母集団からとると母標準偏差となる。 発表の演題は正規乱数のヒストグラムを描こうで、グループ名はありさこで、メンバーは近ありす、立花小春、石垣彩奈、山崎里歩であった。グループ内での役割は書記であった。私たちのグループは、日本男児の7歳の体重のヒストグラムを表した。標準偏差は5.8、母数は28、平均は24.7であった。ヒストグラムを見ると全体的に左側に偏っていて、最頻値は25kgであったことが分かった。 母数が10だとヒストグラムはつながった形ではなく、ばらつきが大きくて形が不安定であった。100のときは左に偏っていた。1000のとききれいなピラミッド型になり、なめらかなヒストグラムとなった。10000だと少し細いピラミッド型になった。母数が大きくなるとばらつきが平均化されたり、打ち消されるため理論的な分布になると分かった。
A.今回はヒストグラムや確率変数について考えました。そこで、分布関数と確率密度関数について考えました。分布関数は確率変数の小さい値から積み上げていった確率の累積であることがわかりました。確率密度関数はある確率変数がでる確率を示したものです。これより、分布関数は確率密度関数を足していったものだと学ぶことができました。マスクウェルのグラフとそれを積分したグラフで表すことができます。また、母平均や標本平均について考えました。母平均を求める場合、測定回数が無限になってしまうため、ほとんどの場合は一部を抽出する標本平均が用いられることを知りました。標準偏差に関して、母集団からとったものを母標準偏差といい、標本からとったものを標本標準偏差と学びました。 グループワークでは母数が1000の時と10の時と100の時で分けてグラフを書きました。結果から母数が多い方が正確なグラフになることがわかりました。
A.今回の品質管理ではデータの性質について様々なグラフなどを用いながら、分析・解析とは何かについて取り扱った。解析を行っていく中で母平均という言葉がある。これは母集団全体における平均値である。しかし、これは理論上の数値として扱うこと多く、実際には標本の平均(標本平均)を用いて分析などを行う事が主流である。また、母平均は求める時に用いる。標準偏差をこのときに気を付けなけれならないのは母集団から取った場合の標準偏差を母標準偏差といい、標本からとった場合は標本標準偏差という。 今回のグループワークでは、パイソンコードを用いて正規乱数のヒストグラムを描きました。実際に男性の身長データを用いながら母数を10,100、1000と変えていく事でそれが実際にヒストグラムを描く際にどのように変化していくのかを確認する事が出来ました。また、母数が少ないとヒストグラムの山が正規分布とは言えない形(二つの山や、右寄りに寄ったり、外れ値)になっていたが母数を増やすことで正規分布に近づくことが分かった。
A.データにおいて、そのデータに適した分布でまとめる必要性について勉強した。ヒストグラムで正規分布に近づかせたいのであれば母数が必要になる。
A.おおよそがわかるよう全体でじゃんけんをしある程度の人数で身長の分布を図った。 Pythonのヒストグラムを使ってグループワークを行った。
A.①誤差と似た言葉に、公差と偏差という言葉がある。公差とは、設定された基準値において、誤差が許容される範囲のことである。偏差とは、個々のデータが、平均値や中央値などの代表値からどれだけ離れているかを表したものである。この偏差を二乗し、全て足して平均化したものを分散という。分散により、データの散らばりがどのくらいかがわかる。この分散の正の平方根を標準偏差という。分散と同じように、データの散らばり具合がわかる。分散は二乗するため、単位がデータと違ってしまうという欠点があるが、標準偏差はこの欠点を補うことができる。 ②母数を変化させた時の、正規乱数の推移を確かめた。母数が10の場合、凹形のヒストグラムができ、正規分布ではなかった。100の場合、中央が少し盛り上がった形になり、1000の場合、正規分布のヒストグラムができた。母数が増えるほど、正規分布に近くなるということがわかった。 ③正規分布の特徴について調べた。正規分布は、左右対称の釣鐘型の曲線を描き、平均値、最頻値、中央値がおおよそ近い値となる。世の中の多くの事象は、正規分布に近い値を示す。
<!-- 課題 課題 課題 -->
<li>
<a href='https://edu.yz.yamagata-u.ac.jp/developer/WebClass/WebClassEssayQuestionAnswer.asp?id=410'>
<q><cite>
</q></cite>
</a>.
<a href='https://edu.yz.yamagata-u.ac.jp/developer/Asp/Youzan/@Syllabus.asp?nSyllabusID='>
<a/a>・
<a href='https://edu.yz.yamagata-u.ac.jp/developer/Asp/Youzan/@Lecture.asp?nLectureID='>
</a>
</li>
<!-- 課題 課題 課題 -->
大学教育の質の保証・向上ならびに 電子化及びオープンアクセスの推進の観点から 学校教育法第百十三条に基づき、 教育研究活動の状況を公表しています。
第百十三条 大学は、教育研究の成果の普及及び活用の促進に資するため、その教育研究活動の状況を公表するものとする。