大学教育の質の保証・向上ならびに 電子化及びオープンアクセスの推進の観点から 学校教育法第百十三条に基づき、 教育研究活動の状況を公表しています。
第百十三条 大学は、教育研究の成果の普及及び活用の促進に資するため、その教育研究活動の状況を公表するものとする。
A.【講義の再話】 前回偏差という指標を用いたが、これには弱点がある。偏差はバラツキであるため、プラスとマイナスの値が混在し、まとめた状態で見れない。これを解消するために生まれたのが偏差平方和であり、バラツキを二乗してすべてプラスで表せるようにしたものである。(母)分散はこれをデータ数で割ったものであり、分散をルートに入れてバラツキの指標としてわかりやすくしたものが標準偏差である。標準偏差はσの記号で表され、品質管理上の基準となる「6σ」はこれのことである。 統計上の重要な操作として、推定と検定がある。ある標本集団のデータから母集団がどのようなデータであるか推測するのが推定であり、検定(有意差検定)とは、ある2つの集団を比較した際に有意差があるか、あるとは言えないかを検定するものである。この時、前提を帰無仮説と言い、これを棄却できるかどうかが検定の本質である。 【発表の要旨】 Pythonのコードを用いて、20歳男性と25歳男性の間に有意差があるかどうかの検定を行った。実際に有意差があると言えるデータがでた。 Writing ? review & editing 【復習の内容】 医学における「確定診断」もある種の有意差検定であると言える。他の病気である可能性を帰無仮説とし、これを全て棄却できる際に診断が確定すると言える。
A.①品質管理におけるシックスシグマについても学んだ。それに付随して、標本標準偏差と母標準偏差の違いについても学んだ。 ②母平均の有意差検定で標本数を1000として、t=-24.993、φ=0.000、xf平均=52.1、xm平均=64.9の時のグラフをPythonで作成した。 ③シックスシグマとは、製品や業務の品質を向上させるための統計的手法と管理手法を組み合わせた品質管理手法である。不良品の発生率を100万回に3.4回以下に抑えることを目標とし、データに基づいた改善を行う。DMAIC(定義・測定・分析・改善・管理)の手順で進められ、製造業だけでなくサービス業など幅広い分野で活用されている。
A.①品質管理におけるシックスシグマについても学んだ。それに付随して、標本標準偏差と母標準偏差の違いについても学んだ。 ②母平均の有意差検定で標本数を1000として、t=-24.993、φ=0.000、xf平均=52.1、xm平均=64.9の時のグラフをPythonで作成した。 ③シックスシグマとは、製品や業務の品質を向上させるための統計的手法と管理手法を組み合わせた品質管理手法である。不良品の発生率を100万回に3.4回以下に抑えることを目標とし、データに基づいた改善を行う。DMAIC(定義・測定・分析・改善・管理)の手順で進められ、製造業だけでなくサービス業など幅広い分野で活用されている。
A. この授業では、母平均と標本平均について学んだ。母平均とは、母集団を確立分布で表したときに、その確率分布に従う確率変数の期待値をことをいう。標本平均とは、ある母集団から採取された標本から母平均のっ推定量としてよく用いられる平均が標本平均である。 発表の要旨では、母平均の区間推定であるt分布について調べてそれを書いた。このデータでは区間推定が9.5、13.9であった。それをグラフにした。 復習では、平均値の有意差検定について調べた。有意差検定とは得られたデータに基づいて2つ以上のグループ間に傾倒的に意味のあるかどうか判断する系統的手法である。
A. 工業生産では100万個に不良品1個レベルの精度が求められる。母集団に関する仮説が正しいかどうかを、標本データに基づいて統計的に判断することを検定といい、母集団の平均や標準偏差はt分布を用いて計算される。複数のグループ間や、ある基準値との間に「統計的に意味のある差があるか」を判断するための手法を有意差検定といい、これもt分布を用いて計算される。 グループワークでは平均値の有意差検定をした。20歳と25歳の男性の身長と標準偏差を選んだ。標本数を、10000、1000、100と減らしていくと、平均値と最頻値の差が開いていき、tの値とpの値はどちらも大きくなっていた。 事後学習では母標準偏差の区間推定標本標準偏差の検定をした。175cm、163cm、162cm、153cmである標本の標本分散は81.58であった。推定される母標準偏差の区間は、[5.12,33.64]である。また、分散は17.64である。標本分散は81.58であるため、大きく異なっていることが確認できた。
A.【講義の再話】 偏差とは測定値と代表値の差のことである。(平均値は代表値の1種)偏差をすべて足した和は代表値によって異なる。この代表値が平均値であった場合、偏差をすべて足すと0になる。すなわち平均値とは偏差が0になるようにとった代表値ということができる。 偏差は符号が不揃いなので二乗してすべて符号をプラスにしてデータの数だけ足していく。これを偏差平方和と呼ぶ。これをデータ数で割ったものを分散という。分散をルートにより開いたものを標準偏差(シグマ:σ)という。 シックスシグマについて、例えば平均値が同じ3日であっても、バラツキが違うことがおおい。このバラツキを6σ以内に収めるために定められたのがシックスシグマである。この指標内に収まっていると顧客に質の高いサービスを提供できている目安となる。 試験の点数を平均50(エックスバー:-x)とする。標準偏差10とおいて置き換えた場合の値を偏差値という。例えば偏差値60なら1σ、偏差値70なら2σ、偏差値80なら3σである。テキスト319ページの図は100人中68人が±1σ、95人が±2σ、ほぼ全員が±3σの範囲に収まっていることを表している。エックスバーは測定値の平均値である。 【発表の要旨】 演題 平均値の有意差検定をしよう(t検定) グループ名 make up!! 役割 責任著者 共著者 鈴木結惟、原野未優、高橋香桃花、三船歩美 21歳日本人女性の平均身長158.7㎝(標準偏差 5.6)を用いて有意差検定をした。 同じく21歳日本人男性168.7㎝(標準偏差 6.1)を用いて有意差検定を行い比較を行った。 グラフに表すと両者の差が目に見えた。 【復習の内容】 トピック名 標本と母集団について 標本標準偏差はnではなく、(n―1)で割る。この値を使って母標準偏差を予想することができる。このように標本を使って母集団の値を推定することを「検定」という。標本平均から母集団の分布を求めるのに用いるのがt分布である。標本の標準偏差から母集団の分布を求めるのに用いるのがカイじじょう分布という。 母平均の差などは差があると仮定して、仮説が正しいかどうか検定するのを有意差検定という。t分布を利用する。ばらつきの比の検定にはF分布を使う。
A. まず、友人の身長データ(156.9cm、145cm、162cm、159cm、169cm)を使用して標本平均を求める。標本 平均は 158.38cm となった。この標本平均が、長鎖された 21 歳女性日本人の平均身長 158.7cm と同じかどうか を検定するために、t 検定を使用する。危険率 5%(α=0.05)を設定し、以下の手順で検定を行う。 t 検定の計算を行う。標本平均(158.38cm)、母平均(158.7cm)、標準偏差(5.6cm)、標本サイズ(n=5)を 使用して、t 値を求める。t 値の計算式は以下の通りである。 t=(標本平均-母平均)/(標準偏差/√n) この場合、t 値は次のようになる。 t=(158.38-158.7)/(5.6/√5)=-0.128 最後に、自由度(df)を求める。自由度は標本サイズから1を引いた値である。今回は標本サイズが 5 なの で、自由度は 4 となる。危険率 5%に対応する両側検定の臨界 t 値は約 2.776 である。計算された t 値は-0.128 であり、臨界 t 値 2.76 よりも小さいため、帰無仮説を棄却することができない。したがって、友人の身長 158.38cm は調査された平均値 158.7cm と統計的に有意な差があるとは言えず、同じであると結論付けることが できる。
A.①標準偏差と偏差は別のものである。偏差とは測定値と代表値の差を指し、これを二乗して平均したものが分散となる。そして、分散の平方根が標準偏差である。標準偏差はデータのばらつきを表す指標として用いられ、品質管理の分野ではシックスシグマが知られている。これは平均から±6σ以内にほぼ全てのデータが収まり、不良率は100万回中わずか3.4回という高品質な状態を示している。また、母集団の標準偏差は通常わからないため、無作為抽出で得た標本から標本標準偏差を計算し、母標準偏差を推定する。このとき用いられるのがχ?分布であり、他にもt分布やF分布などが統計的推定に活用されている。 今回のグループワークは、母平均を区間推定しよう(t分布)である。 ②演題は母平均を区間推定しよう(t分布)であり、グループ名は一番前、属した人は、小笠原大地、日下陽太、小野翔太、坂本彩夏、佐々木悠杜、須藤春翔であり、役割は調査係。 実際にグラフを書いた。そして、母平均が大きいほどより直線に近い分布になり、正確性が上がり、有意差が小さくなるという結論に至った。 ③私は、χ?分布 やt分布やF分布などが統計的推定にどのように活用されているのか調べた。 χ?分布は母分散の信頼区間の推定や適合度検定に、t分布は母平均の信頼区間や差の検定に用いられる。また、F分布は2つの母分散の比に関する検定に使われ、製品のばらつきの比較などに応用される。 これらの分布を用いることで、限られた標本からでも、一定の確率のもとで母数の推定や仮説検定が可能となる事が分かった。
A.
A.①分散は標本と平均の差を二乗し足し合わせ、標本数で割ると得られる。3.29σの片側信頼確率は0.0005%であった。主に標本から母平均を推定するときはt分布を使うんだ。ほかにもχ二乗分布やF分布、有意差検定など推定方法は多岐にわたるんだ。目的に合った検定方法を選ぶのが重要だ。 ②「平均値の有意差検定をしよう(t検定)」グループ名:一番前、小野、日下、須藤、佐々木、坂本、役割:調査 標本数を変えて有意差検定をした。女性と男性では母平均はそれぞれ52.2、64.8であった。そこで標本数を変えると有意差検定のプロットが濃くなったり薄くなったりする。標本数1000の場合、女性も男性もだいたい母平均と同じプロットの密度になった。正確性があがった。 ③ 友人5人の身長を調べた。それぞれ171cm,160cm,170c,155cm,169cmであったので、標本平均は165cmである。 標本数が5なので、自由度は4である。信頼水準95%なので、片側2.5%ずつである。t分布表を用いると、確率0.025のとき自由度4で2.78であった。「計量管理の基礎と応用」p99、(4.60)式より165-2.78*7.1/√5=156cm、165+2.78*7.1/√5=182cmより、95%信頼区間の下限上限は156cm,182cmである。
A.① 講義の内容 シックスシグマ6σについて学んだ。このシックスシグマとはバラツキの原因を除去して「いつでもお客様に質の高い、画一的な製品やサービスを提供しよう」という考え方のことである。また標準偏差σはデータの分布が正規分布に従う場合データの68.27%はσ、95.45%は2σ、99.73%は3σの範囲に入っている。また母平均の差の有意差検定(t検定)を行った。 ② 発表の要旨 20歳男性の体重についてのt検定を行いました。母数は1000、標本数は12、平均値は57.0、標準偏差は8.8であった。μmは64.8と求められた。t検定は、2つのグループの平均値に差があるかを検定する統計手法のことである。母集団の分布が正規分布であると仮定し、差が偶然か有意かを判断しる際に使われる。母平均は測定値の算術平均のことをさし、測定値の総和を標本数で割って平均する。 ③ 復習の内容 標準偏差は、データのばらつきを示す統計指標で、平均からの距離の平均を表す。値が小さいほどデータは平均に近く、ばらつきが少ないことを意味している。逆に大きいとばらつきが大きく、データが広く分布していることを示す。偏差を二乗してその平均を求め、この分散の平方根を取ると標準偏差が求められる。
A. 測定値が 0.51, 0.53, 0.55, 0.50, 0.49 の場合、ある代表値からの偏差(測定値と代表値の差)の和は0.13となる。偏差の和は代表値の選び方によって異なるため、どの値を基準とするかが重要である。統計的な品質管理の考え方の一つに「シックスシグマ」があり、これはアメリカのモトローラ社が品質不良による損失を減らすために開発した。欠陥の発生を±6σ(シグマ)以内に抑えることを目標とし、高品質な製品づくりを実現するための手法である。また、標準偏差は分散の平方根として求められ、データのばらつきを表す。標準偏差や分散を用いた仮説の検定には、X?分布、t分布、F分布などが用いられ、特にt分布は有意差検定によく使われる。これは、二つのデータに統計的な差があるかを判断する方法である。母平均とは有限の母集団からの平均であり、標本平均は無限母集団からの一部データによって推定される。これらの概念は、製品の品質評価や管理に不可欠である。
A.今回の授業では偏差平方和の公式を学んだ。また、標準偏差の二乗をすることで期待値を求められるということが分かった。標準偏差とはデータのばらつきを確認するためのもので確率変数分布の正の平方根です。データがどれだけ離れているかをあらわしていて、ばらつきが多いほど値も大きくなると分かっています。また、標準偏差は母集団のデータすべてを使った標準偏差で、標本標準編差は母集団から標本を選び抜いた標準偏差です。 グループワークでは平均値の有意差検定をしようということでPythonを使用しました。一歳男児の身長の平均は79.6cm、標準偏差は4.7で、体重の平均15kg、標準偏差は10.3で、一歳女児76.6cm、標準偏差は4.2で、体重の平均は9.7kg標準偏差は1.4でした。これを使用しました。男児の母数は15,女児の母数は14ということも使用しました。 標準偏差について詳しく調べました。標準偏差とは、データのばらつきを示す統計指標で、平均からの各値のズレの大きさを数値化します。値が大きいほどデータの散らばりが大きく、小さいほど一様に近いことを意味します。誤差や品質管理の分析など、実務でも広く使われるそうです。
A.①偏差の和と平均値、偏差平方和、分散、標準偏差、シックスシグマ、偏差値、正規分布、t分布、F分布、x^2分布などについて学びました。偏差(測定値―代表値)の和がゼロになるような値が平均値だと分かりました。また、偏差をすべて正にするために平方をとり(2乗し)、合計した値を偏差平方和:S といい、偏差平方和の平均値(母数で割った値)が分散:σ^2 であり、ルートをとったのが標準偏差: σ であることが分かりました。この標準偏差σは、正規分布曲線において、各点の平均線(最頻値、最大値の時の横軸の値)からのずれ(距離)を表しています。この正規分布と標準偏差σの関係性を用いたシックスシグマ(6σ)の管理手法による品質管理があります。これは、欠陥の発生機会を6σ以内に抑えるという手法です。正規分布は製品のスペックの割合の分布を示す関数で、正しい工程で製品が作られると、グラフは最大値(=最頻値)をもつ山のような曲線になります。正規分布における最頻値は、その製品のスペックの平均値に一致します。偏差値はその平均値からのずれ(σ)の度合ごとのグラフで囲まれた面積を表しています。また、有意差検定にはt分布、ばらつきが同等であるかの検定にはF分布、標本標準偏差から簿標準偏差の推定にはx^2分布が使われます。 ②グループ名は一番前です。グループメンバーは小野翔太、小笠原大地、須藤春翔、佐々木悠杜です。発表では平均値の有意差検定を行いました。まず、男女の名義尺度を分けて、値をそれぞれ入力してヒストグラムを作成しました。それらの最頻値を平均値として、t分布を出力して有意差検定を行いました。今回は母平均を1000としてt分布を作成しました。得られたt分布より、母平均が大きいほど直線に近い分布になり、正確性が上がる、すなわち、有意差が小さくなることが分かりました。 ③復習ではt分布、F分布、x^2(カイ二乗)分布についてそれぞれ詳しく調べました。t分布は標本が正規分布に従い、母分散が未知の時に、小標本から母平均を推定、検定するための分布でした。自由度がn の時のt分布と n-1 の時のt分布とを比較することで有意差検定が行えます。F分布は2つの分散の差を比較するために使われる確率分布で、分散分析や回帰分析など、統計的な仮説検定によく用いられます。式には2つの標本の分散と、それぞれの自由度が使われており、自由度が高いほどF分布は正規分布に近づきます。2つの分散の有意差を検定する手法をF検定といいます。x^2(カイ二乗)分布は、ばらつきや偏りの大きさを評価する統計分布で、式中にある自由度が大きくなると正規分布に近づきます。
A. 第10回の講義では、2種類の標準偏差や代表値について理解を深めた。標準偏差には母標準偏差と標本標準偏差の2つがある。前者は対象が母集団全体であり、母集団すべてのデータが明らかな時や正規分布の場合でしか用いることはできない。対して、後者は対象が母集団から抽出した一部(標本)のデータであり、標本から母集団のばらつきを予測する目的で用いられる。これは母集団全体のデータが明らかでないときに利用される。標本標準偏差では、小さい標本サイズではばらつきが過小評価されることから、n-1(=自由度)で割ることで偏りを補正している グループディスカッションでは、「演題:平均値の有意差検定をしよう(グループ名:ありふさこ、共著者名:近ありす、石垣彩奈、山崎里歩、役割:書記)」について議論を進めた。私たちのグループは、20歳男性と女性の体重についてt検定を行った。母数1000、標本数12、平均値57.0、標準偏差8.8に設定したところ、t=-1.799と導かれた。 ここで、t検定についての知識が足りなかったため、理解を深めるためにもう少し詳しく調査を行った。t検定とは、2つの平均値を比較してその差が偶然なのか、もしくは統計的に有意な差なのかを判定するための検定である。この時、帰無仮説(平均理に差はないと仮定)と対立仮説(平均値に差があると仮定)を立て、標本データからt値を求める。そしてt分布を用いてp値をもち引き、p値が有意水準以下であれば帰無仮説を破棄することができる、といった流れであると分かった。
A.偏差とは、各データ点が代表値からどれだけ離れているかを示す値である。代表値を平均値とすれば単純に平均からの差と捉えることができ、その偏差を合計した値は0になる。 標準偏差とは、データ全体のばらつきを示す指標であり、偏差の二乗平均の平方根として求められる。標準偏差が小さい場合、データは平均値に近いことを示し、標準偏差が大きい場合、データは広範囲に分布していることを意味する。これらを応用したのがシックスシグマであり、これは、製造やサービスにおける工程能力を統計的に評価改善し、欠陥率を100万分の3.4以下にまで抑えることを目的とした品質管理改善手法である。 発表では1歳の日本人男女の身長のと標準偏差から有意差検定を行った。ヒストグラムの形から女は男の図を左にずらしたような値を取ったため、これらは、統計的に意味を有する差であると考えた。 復習として成績に用いられる偏差値はどのように計算されているのかを調べた。
A.今回の授業では平均について学びました。平均値は外れ値があると大きく異なる値が出てくるため、指標にするには正確性に欠けるものだということを学びました。 今回の発表では20歳男性と25歳男性の体重を比較しt検定を行いました。 t検定の応用について調べました。t検定は品質管理のほかに効果測定やアンケート結果の分析に利用されるということがわかりました。
A.1.誤差、公差、偏差の中の偏差について取り上げる。まず、偏差とは、測定値と代表値の差のことである。代表値とは、平均値が含まれる。これにより、偏差を求め、その値を二乗することで、どれだけ値に差があるのか、ばらつきがあるのかを分散という形で見ることができる。さらに、この分散のルートをとると、標準偏差となる。 これらを、正規分布と照らし合わせることで、ある割合の部分ではどのくらい標準偏差があるか求めることができる。 2.私たちのグループでは、グループ名を一番前とし、Pythonコードを使って、平均値の有意差検定を行った。比較で二種類のヒストグラムを用意し、その有意差検定を行うと、母平均が大きいほど直線に近い分布をとり、正確性が上がり、有意差が小さくなると結論付けた。 3.6σについて調査した。6σとは、値のばらつきの原因を除去して、いつまでもお客様に質の高い画一的な製品やサービスを提供しようという考え方のもとに誕生した。 6σは、ばらつきに注目し、DMAIC(定義、データ収集、分析、改善、管理)の考え方のもと業務プロセスや、経営上の問題を解決する。
A.①偏差は代表する値によって数値が異なる。代表する値とは測定値のうちどれかの値を指す。標準偏差はσで表す。σとはばらつきの大きさの基準として使用する。有意差検定では2つの値を測定し、t分布を良く使う。分布にはF分布もある。F分布とは、統計学で使われる確率分布の一つで、特に分散分析や標本間の等分散性の検定に使われる重要な分布である。 ②発表では、1歳の男児と女児の身長の平均値と標準偏差について調査し、ヒストグラムで表した。男児の母数は15、女児の母数は14であり、それぞれ平均値は男児が79.6㎝、女児が76.6㎝であった。また標準偏差は男児が4.7、女児が4.2であった。 ③復習では、シックスシグマについて詳しく調査した。シックスシグマ(Sとは、主に製造業で用いられる、品質管理と業務改善のための手法であることが分かった。統計学的な手法を用いて、製品やサービスの品質を向上させ、ばらつきを減らすことを目指す。
A. 標準平方和はデータの各値と平均値の差の二乗の和で求められる。また偏差は標準平方和をデータの数で割ると求められる。標準偏差は偏差に平方根をつけることによって求まる。また、6σという考え方があり、これはばらつきの大きさの目安として用いる。例えば、A社とB社で比較したときにヒストグラムが横にひろがっているほど、ばらつきが大きいというように判断できる。 グループワークでは平均値の有意差検定をしようということでPythonを使用しました。一歳男児の身長の平均は79.6cm、標準偏差は4.7で、体重の平均15kg、標準偏差は10.3で、一歳女児76.6cm、標準偏差は4.2で、体重の平均は9.7kg、標準偏差は1.4でした。これを使用しました。男児の母数は15,女児の母数は14ということも使用しました。 今回の講義で取り扱った6σという考え方についてより詳しく調べた。シックスシグマとは「DMAIC」という、論理的な流れて進めていく。DはDefine(定義)、MはMeasure(データ収集)、AはAnalyze(分析)、IはImprove(改善)、CはControl(管理)という5つのフェーズの中で、統計的分析手法及びQC7つ道具などの品質管理手法を的確に使用しながら、業務プロセスや経営上のさまざまな問題を解決する。
A.①測定値と平均値との差を偏差と呼ぶ。すべての偏差を合計すると0になる。ただし、代表値として平均値以外を選ぶと、この合計値は変化する変化の合計が0になる。代表値は平均値である時である。工場の仕組みの154ページではばらつきを± 6σに抑えると言う品質管理の考え方が紹介されている。この考え方から平均値を50、標準偏差を10とした場合、偏差値70は平均から±にシグマ平均80 = ± 3σに相当する偏差値80のように3σを超える人は非常に稀である。 ②発表ではpHメーターについて調べた。水素濃度一定の内部液中に基準電極を入れ、ガラスの薄膜で覆ったガラス電極と試験電極中の外部の基準電極との電位差を測定することでpH測定が可能になっている。pH電極を標準溶液に浸したときの膜電位の差を表した式によって数値に変換させている。 ③このσと言う考え方について調べた。シグマは、統計における標準偏差を表す記号である。σが小さい時は、データは平均値の近くに集まっており、σが大きい場合はデータにばらつきがあると言うことがわかる。最近では、シグマの概念には、AIやビックデータ分析にも用いられている。例えば、センサーの異常検知や異常値の判断に標準偏差を使い、リアルタイムでシステムの安定性を見極める技術がある。
A. 偏差について偏差平方和や分散、標準偏差の求め方や計算式について講義を行った。また、シックスシグマが100万個に3?4個の割合であること、t分散やχ^2分布、F分布などの有意差検定についての基礎について学んだ。 発表では、平均値の有意差検定(t検定)として男女の体重の2標本について検定を行った。この時の標本数は1000と10000の2つの場合で計算、結果をまとめた。 復習として、シックスシグマについてより詳しく考えた。シックスシグマとは、製品や業務プロセスの品質を徹底的に改善するためのマネジメント手法で、統計学を用いて欠陥(不良)の発生率を限りなくゼロに近づけることを目的とする。このσという文字の意味は標準偏差を表しており、シックスシグマとは±6σ以内に99.99966%のデータが収まる、つまり極めて稀にしか不良が出ない状態を意味する。シックスシグマの基本サイクルとしてDMAICというものがある。D:Define、M:Measure、A:Analyze I:Improve、C:Controlの頭文字をとったものである。
A. データのばらつきを確認するために、確率変数分布の正の平方根である標準偏差(σ)が指標として用いられます。標準偏差は、データが平均からどれだけ離れているかを示し、ばらつきが大きいほど値も大きくなります。また、統計的なデータが偶然ではなく意味のある違い(有意差)があるかどうかを確認するために用いられるのがt検定です。t検定は、母集団の分散がわかっていなくても推定を行うことで検定を行うことができます。 演題は「平均値の有意差検定をしよう(t検定)」で、グループ名はありふさこです。共同著者は、近ありす・立花小春・山崎里歩です。私は発言の役割を果たしました。私達のグループは、20歳の日本人男性の平均体重を選び有意差(t)検定を行いました。参照したサイトより母数1000人、標本数12人、平均値57.0㎏、標準偏差8.8㎏を用いたところ、μm=64.8、t=-1.799となりました。このことから、標本平均が母平均よりやや低いということが分かりました。 本授業では、シックスシグマの管理手法について学びました。シックスシグマとは、ばらつきを6σ(100万個あたり3、4個)以内に収めるという目標を設定し、実現する活動です。シックスシグマでは、「DMAIC」という、定義(D:Define)→データ収集(M:Measure)→分析(A:Analyze)→改善(I:Improve)→管理(C:Control)の流れで進めていきます。このように、厳しい目標を設定することで製品の信頼性が向上し、品質不具合による損失コストなどを抑えられると考えました。
A.①今回の講義では、始めに、前回の授業の復習を含めて、偏差について討論した。偏差とは、測定値と代表値の差であり、平均値は代表値の一種であることがわかった。また、教科書を参考に、シックスシグマについて学んだ。シックスシグマとは、品質不具合による損失コストを減らすために考えた方式である。欠陥の発生機会を100万オペレーションにつき3?4回に抑える目標を設定し、これを実現する活動である。シックスシグマでは、DMAICという論理的な流れで進めていく。(定義、データ収集、分析、改善、管理) ② 今回のグループワークでは、1歳の日本人男女の身長のと標準偏差から有意差検定を行い、グラフを作成し変化を視覚的に理解した。ヒストグラムの形から女は男の図を左にずらしたような値を取ったため、これらは、統計的に意味を有する差であると考えた。 ③今回の授業では、平均値の間推定や、ロットアウトについて学んだ。平均値と測定値の差を偏差とすると、全部の偏差を足すと0になることがわかる。だが、代表値を平均値を取らなければ、偏差は変化する。偏差平方和や、標準偏差の式についても理解を深めた。シックスシグマに関しては向上の仕組みの教科書で学んだ。シックスシグマとは、ばらつきを6σまでに抑えようと言う考え方である。例として平均値を50点標準偏差10に置き換えたとこを偏差値と言う。また正規分布、x2分布、T分布、f分布について学んだ。
A. 偏差とは測定値と代表値との差を示す。偏差の和は代表値をどこにとるかによって変わる。平均値を代表値として取ったときは0になる。つまり、平均値とは、偏差の和が0になるように、とられた値のことである。偏差を二乗して、足したものである偏差平方和は必ず正の数になる。偏差平方和を測定個数で割ると、分散になる。標準偏差σとは、平均値からの偏差の平方根で求めることができる。これはデータのばらつきを知るために使われる。 シックスシグマはばらつきの原因を除去することで、いつでも品質が高く、画一的な製品やサービスを提供するために生まれたものである。また、品質不具合による損失コストを削減するために考えたものである。 偏差値とは、平均値をσに置き換えたものである。平均値が50の時ときに、偏差値60だった場合、1σとなる。正規分布曲線とx軸に囲まれた面積を100としたとき、それぞれの範囲の面積は±1σの場合は68.27、±2σの場合は95.45、±3の場合は99.73である。 母標準偏差、母平均は推定することができる。母集団の標準偏差のことである。 標本標準偏差の分母は(n-1)となる。母標準偏差の推定量として用いられる。なぜこの分母なのかは自由度が関係する。自由度は独立変数の数である。分母が(n―2)の時は、xとyの平均を用いるためである。最小二乗法で使う。 母標準偏差の分母はnとなる。よって、標本標準偏差と母標準偏差の計算式は異なる。 カイ二乗分布とは、標準偏差の推定と検定に用いられる。他には、t分布とf分布がある。 有意差検定とは、仮説が有効であるか検定することである。2つのデータの間に有意差があるかを調べるものである。
A.【講義の再話】 母平均と標本平均について学んだ。偏差値は測定値と代表値の差であり、平均値とは代表値の一つである。偏差は代表値をどこに取るかによって変化し、平均を代表値とすると偏差は0になる。代表値に何を取るのかが大事。偏差平方和は各データとその平均値との差をそれぞれ二乗し、それらすべてを足し合わせたものであり、ばらつきの具合を示しことができる。 全体をカウントしたものを母標準偏差と、母平均となる。しかし、実際の工場ではこのようにすべてのものを検査することなく、標本標準偏差や標本平均から推定していく。この時に検定をおこなう。 標本平均から母平均を推定する際には、t分布を用いる。 標本標準偏差から母標準偏差を推定、検定する際には、かい二乗分布を用いる。t分布、かい二乗分布、f分布は分析の際の三種の神器であることが分かった。一つの標本から母集団への平均を推定するよりも、二つ以上の標本平均から母集団の平均を推定することが多い。 複数の標本からもとめた母集団についての差を有意差検定することが多い。また、有意差検定にはt分布を用いる。 σについては、ばらつきが同じかどうかの検定を行う。これにはf分布を用いる。 【発表の要旨】 演題は平均値の有意差検定(t検定)であり、グループ名は学生証であった。グループに属した人は高橋香桃花、久保明裕、三船歩美、鈴木結唯、増子香奈であった。 21歳の日本人女性と日本人男性の平均身長の差からt検定を行った。私は調査係としてパイソンを用いてt検定を行った。その結果有意差があると認められた。 【復習の内容】 母集団の標準偏差を標本標準偏差から推定する方法について調べた。母標準偏差の推定値には誤差が含まれるため、信頼区間を求めることで、推定の精度を評価したり、標本数が少ない場合はn―1を掛けることがあるとわかった。
A.平均値の区間推定を学んだ。測定値は左右対称の山形のヒストグラムで表され、正規分布で近似することが出来る。また、多くのデータでどのようにばらついているか示す目安として標準偏差σが用いられる。これは、測定値と平均の差を二乗したものを1からn番目まで足した数をn-1で割り、その値を二分の一の累乗したものである。これに関連してΧ^2分布、t分布、F分布を学んだ。 演習では日本人の年齢、体重または身長の平均値と標準偏差を選び、グラフに起こしたとき標本数を変えると母平均と標本平均の関係がどう変わるかを調べた。2019年の20歳男性と20歳女性の身長を入力した。標本数を変えると母平均と標本平均は大きく変わった。 ほかの演習では母分散未知、危険率5%として、友人の身長を無作為抽出し、標本平均を求めた。友人の身長が170cm、156㎝、172㎝、158㎝より標本平均は(170+156+172+158)/4=162㎝。標本数が4より自由度は3。信頼係数95%よりt値は3.182で、信頼区間は標本平均±t値×標準誤差より162±3.182×√(1/5((170-162)^2)+(156-162)^2)+(172-162)^2)+(158-162)^2))で141㎝から183㎝と求めることが出来た。
A.偏差とは? 測定値と代表値の差 代表値…平均値、目標値など 代表値が平均値の時、偏差=(測定値-平均値)となり偏差の合計は0になる 例)2,5,10,7,6 の値があるとき、 平均値は(2+5+10+7+6)/5=6 それぞれの偏差は-4,-1,4,1,0であり、この合計は0になる 代表値がなにか確認すること?? 代表値=平均値という思い込みは? 偏差は+、-があり、ばらつきを表すときに分かりにくい! →偏差を全て2乗して符号を消し(偏差平方和)、これを与えられた値の数nで割ると分散(期待値)が求められる これに√かけたのが標準偏差σ (単位修正のため 例:cmとか分かりにくい) テストの点数を平均50,標準偏差10に置き換えたときの値=偏差値 偏差値60は1シグマ、80は3シグマ ±1シグマに何%の人が入っているか? 化学工学p319 ±1σ=68.27% ±2σ=95.45% ±3σ=99.73% シックスシグマ法 「100万回の作業を実施しても不良品の発生率を3.4回に抑える」 計量p276表1 3.29σの時の片側確率(上側確率Φ) 標準正規分布の場合、T分布の場合、F分布、カイ二乗分布の場合などよく使う 化学工学p319 母集合から無作為抽出で選んだ標本から標本標準偏差と標本平均をもとめ、母標準偏差と母平均を推定する。 また、標本が平均から大きくずれていないか確認する(検定)。 標本平均から母平均を求める際に推定、検定を行うときはT分布の表より求める。 計量p89 標本標準偏差から母標本標準偏差を求めるとき、推定検定に使うのがカイ二乗分布 計量p88 標準偏差の比を求めたときの分布F分布 カイ二乗、t,fは三種の神器?? 二つの分布を比べるとき ?母平均の差 をよく比べる 各値にはばらつきがあって比べられない→母平均からどちらが大きい、どちらが小さいか判断する ・有意差検定(T分布)…差があると仮定してあるかどうか調べる ・ばらつき、比があるか調べる(f分布) 例)薬が効いているかどうか?
A. 偏差について学んだ。偏差は測定値と代表値の差であり、代表値は平均値などがある。偏差を足してもばらつきの区別はつかないが二乗してたすことで解決する。これを偏差平方和という。また、シックスシグマについても学んだ。品質不具合による損失コストを削減するために欠陥の発生機会を6σ以内に収めるという目標を設定し、これを実現する活動である。それから、推定と検定について、T分布やカイ二乗分布、F分布がある。有意差検定とは比較対象とするデータの差異が偶然生じたものか、そうではないのかを統計を使って確かめることである。 発表の演題は平均値の有意差検定をしよう(t検定)で、グループ名はありふさこで、メンバーは近ありす、立花小春、石垣彩奈、山崎里歩であった。グループ内での役割は発言であった。私たちのグループは20歳男性の体重について調べた。母数1000、標本数12、平均値57.0、標準偏差8.8であった。μm=64.8であった。グラフはピラミッド型になった。 標本数が少ないと誤差が大きく分散、標準偏差の値は安定しない。標本数が増えるほど標本平均は母平均に近づき、ばらつきが減る。危険率は仮説検定をするときに仮説を棄却するかどうかを判断するための基準である。一般的に危険率は0?1の範囲で値をとる。男女100人ずつの標本があれば、高い確率で有意差を検定できると考えられる。
A.
A.今回の第十回目の講義では平均値の区間推定とロットアウトについて取り扱いました。まず推定と検定とはなにかについて教科書から読み解きました。これらは統計において母集団の性質を理解するためにあり、推定は未知の母集団のパラメータを推測する事であり、検定は母集団についての仮設が正しいか判断する事です。たとえば、x^2分布やt分布などから信頼区間を求める事が出来ます。この信頼区間は推定を行う際に母平均がこの辺にあるだろうという仮定の範囲を指します。有意差検定は例えば二つの事柄に差がないと仮定してデータから判断を行う事である。 今回のグループワークでは、平均値の有意差検定を行った。この班では、20歳と25歳の男性の身長と標準偏差を選んで検定を行った。標本数を10000から1000、100と減らしていくと平均値と最頻値の差が大きくなっていき最終的にtの値とpの値が大きくなっていく事がパイソンによる動きで分かった。 復習として、95%信頼区間について調べた。これは真の値がこの範囲の中にあると95%信頼する事ができるという重要な概念である。しかしこれは、95%の確率でこの区間に入っているという事を示しているわけはないから気を付けなければならない。
A.
A.
A.①標準偏差のσは、正規分布曲線において、各点の平均線からのずれを表している。この正規分布と標準偏差の関係性を用いたシックスシグマ という管理手法がある。これは、製品の欠陥やサービスの不具合を、6σ以内(100万回の内に3、4回以下)に収めることを目指す考え方である。確率分布には、正規分布以外にも、t分布、F分布、x^2分布などがある。 ②平均値の有意差検定を行った。男女の名義尺度を分け、値をそれぞれ入力してヒストグラムを作成し、それらの最頻値を平均値としてt分布を出力し、有意差検定を行った。t分布から、母平均が大きいほど直線に近い分布になり、有意差が小さくなることが分かった。 ③確率分布について復習した。t分布は、標本が正規分布に従い、母分散が未知の時に、小標本から母平均を推定、検定するための分布である。F分布は、2つの分散の差を比較するために使われる確率分布である。x^2分布は、ばらつきや偏りの大きさを表す分布である。
<!-- 課題 課題 課題 -->
<li>
<a href='https://edu.yz.yamagata-u.ac.jp/developer/WebClass/WebClassEssayQuestionAnswer.asp?id=411'>
<q><cite>
</q></cite>
</a>.
<a href='https://edu.yz.yamagata-u.ac.jp/developer/Asp/Youzan/@Syllabus.asp?nSyllabusID='>
<a/a>・
<a href='https://edu.yz.yamagata-u.ac.jp/developer/Asp/Youzan/@Lecture.asp?nLectureID='>
</a>
</li>
<!-- 課題 課題 課題 -->
大学教育の質の保証・向上ならびに 電子化及びオープンアクセスの推進の観点から 学校教育法第百十三条に基づき、 教育研究活動の状況を公表しています。
第百十三条 大学は、教育研究の成果の普及及び活用の促進に資するため、その教育研究活動の状況を公表するものとする。