🏠
令和6年10月7日 (月)

平均値の区間推定- ロットアウトを防ごう-

山形大学  理工学研究科(工学系)  化学・バイオ工学科  🔋 C1 📛 立花和宏

🔚 品質管理 🏫 Web Class syllabus 53225 📆 🌸 時間割 🕐 13:00~14:30 🕝 ( 中示BFiles C1

対照実験(コントロール実験)

  1 対照実験 ( コントロール実験 )
対象 効果の有無 誤るリスク
コントロール 効果がある 効果があるのにない誤るリスク
コントロール 効果がない 効果がないのにあると誤るリスク
卒業研究 実験 06 化学バイオ工学実験 165 品質管理 123 無機工業化学

科学の方法において、 目的とする仮説の検証をするとき、 比較の対照となる基準を、コントロールとかブランクとか言います。

コントロール群(対照群)と「処理(治療)群」で効果の有意差を検定するときは、 独立変数をコントロールし、未知の要因は ランダム化 します。

薬理効果の場合は、プラセボ効果も ランダム化 します。 また、二重盲検によって実験者もランダム化します。

数学と数値計算

プログラミング言語

  2 プログラミング言語の種類
種類 分類 言語 特徴
インタプリタ Webアプリ JavaScript Webブラウザ上で動作(クライアントサイド)
vb script(vbs,vba,asp) 1 ) 1964 開発 キーボードとディスプレイが必要
AI Webアプリ python パイソン 2 ) * ビッグデータ データサイエンス * 、 マテリアルズインフォマティクス *、AI
教育 Scratch ビジュアルプログラミング
コンパイル OS C 3 ) ポインタ、構造体
汎用 VB.NET オブジェクト指向(多重継承なし)
汎用 Kotlin アンドロイドアプリ向け
OS C++ オブジェクト指向
colab jupyter

ファイルベースのシステムでは、コンパイラ言語は実行可能なファイルを生成し、 インタプリタ言語はそれを生成しないという違いがありました。 しかし、クラウドベースになって、実行ファイルそのものをクライアントにダウンロードしなくなり、 ジャストインコンパイルで実行結果だけを利用するようになると コンパイラ言語とインタプリタ言語の違いは、あまり本質的でなくなりました。

科学技術用の伝統的な言語としては、FORTRANがあります。 FORTRAN系列の言語としては、BASIC、pythonがあります。 統計用言語としてRがあります。

アルゴリズム重視の伝統的な言語としてALGOLがあります。 ALGOLは、Pascal, C, C++, C#,java, javascript, typescript, Kotlinと進化してきました。 juliaはCに迫る計算速度を誇ります。

サーバーサイドで使われてきたPerlや Ruby もクラウドで利用できるようになってきました。

人工知能で伝統的な言語Lispは、F#Schemeもクラウドで利用できるようになってきました。

人気 プログラミング言語 は、java script、そしてpython*と続きます。 *


体重

  3 21才女性の体重データの例
番号 番号 番号 番号 番号
1  57.28 2  62.90 3  38.08 4  63.17 5  39.08
6  47.36 7  44.18 8  50.98 9  59.89 10  61.56
11  59.08 12  48.64 13  53.29 14  53.32 15  41.65
16  53.77 17  45.24 18  38.90 19  51.13 20  54.10
21  68.92 22  49.79 23  35.89 24  44.54 25  54.39
26  51.32 27  47.29 28  50.00 29  64.81 30  54.71
31  61.22 32  49.13 33  54.70 34  61.10 35  56.39
36  31.54 37  52.76 38  43.01 39  60.55 40  46.70
41  51.02 42  50.35 43  41.27 44  33.79 45  49.17
46  57.32 47  56.43 48  64.89 49  50.44 50  58.08
51  37.40 52  61.44 53  62.08 54  42.33 55  44.46
56  45.27 57  66.89 58  46.85 59  60.07 60  61.96
61  63.89 62  46.12 63  66.06 64  57.27 65  52.47
66  64.86 67  44.07 68  66.24 69  48.16 70  44.72
71  43.63 72  46.44 73  51.40 74  47.29 75  53.89
76  45.54 77  52.85 78  49.94 79  57.97 80  50.50
81  34.15 82  62.22 83  42.31 84  43.66 85  53.68
86  56.91 87  47.03 88  61.36 89  44.97 90  44.05
91  33.10 92  48.61 93  40.71 94  51.68 95  64.05
96  35.64 97  50.42 98  53.28 99  49.91 100  45.78
  4 統計量
項目 全数検査(母集団) 抜き取り検査(標本)
母数n=100 標本数=12
平均 母平均 μ =51.21 標本平均=x_ 51.06
標準偏差 母標準偏差σ=8.63 標本標準偏差s=8.45
分散(Variance) 母分散σ2=74.49 不偏分散s2=71.41
偏差平方和 S=5,120.71 S=612.68

標本標準偏差は、母標準偏差の 不偏推定量ではないが、母標準偏差の推定は、 近似的に標本標準偏差で行うことが多い 4 ) 5 )


平均

  5 平均
アプリ言語 プログラム例
母平均μ 標本平均x_
SQL * select AVG(price) from products
Python * average = statistics.mean(data)
average = np.mean(data)
Google sheet * E3= AVERAGE(B3:D3) E4= AVERAGEA(B3:D3)
Excel * E3= AVERAGE(B3:D3)

母平均は ギリシャ文字μ で表し、標本平均は、ラテン文字(ローマ字、アルファベット)のxにバーをつけた x_ で、表現することが多いです。

算術平均のほかに、調整平均(トリム平均)も使われます。 6 ) 7 )

*

標準偏差

  6 標準偏差
アプリ言語 プログラム例
母標準偏差σ 標本標準偏差s
SQL * * select STDEVP(price) from products select STDEV(price) from products
Python 8 ) * print(np.std(df.Age))
print(np.std(df.Age, ddof=1))
std = statistics.stdev(data)
*
Google sheet * =STDEVP() =STDEV()
Excel * =STDEV.P()
=STDEVP()
=STDEV.S()
=STDEV()

母標準偏差は ギリシャ文字σ で表し、標本平均は、ラテン文字(ローマ字、アルファベット)の s で、表現することが多いです。

9 ) 10 ) 11 )


正規乱数のヒストグラムと、そこから無作為抽出されたヒストグラム

  1 正規乱数のヒストグラムと、そこから無作為抽出されたヒストグラム
©K.Tachibana
確率分布

正規乱数のヒストグラムと、そこから無作為抽出されたヒストグラムム

import numpy as np
import matplotlib.pyplot as plt
import random

sm = 52.2 # 平均(母平均)
ss = 9.5 # 標準偏差(母標準偏差)
sn = 10000 # 母数
en = 5 # 標本数
x = np.random.normal(loc=sm, scale=ss, size=sn)
sampled = random.sample(x.tolist(), en) #無作為抽出

fig = plt.figure()

ax1 = fig.add_subplot(2, 1, 1)
ax2 = fig.add_subplot(2, 1, 2)

ax1.hist(x)
ax2.hist(sampled)
plt.show()

average1 = np.mean(x)
stdev1 = np.std(x)

average2 = np.mean(sampled)
stdev2 = np.std(sampled)

print('inf',sm,ss)
print(sn,average1,stdev1)
print(en,average2,stdev2)

©K.Tachibana

平均値の有意差検定(t検定)

  2 母平均の有意差検定( t 検定)
©2023-2024 K.Tachibana * , C1 Lab.
python (colab)→ pngsvghtml
12 )

平均値の有意差検定

# ■■■ 平均値の有意差検定 ■■■

import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as patches
import random
from scipy import stats

sm = 52.2 # 平均(母平均)
ss = 9.5 # 標準偏差(母標準偏差)
sn = 10000 # 母数
en = 5 # 標本数
x = np.random.normal(loc=sm, scale=ss, size=sn)
sampled = random.sample(x.tolist(), en) #無作為抽出
y = [ 0.5 for p in sampled]

smm = 64.8 # 平均(母平均)
ssm = 13.9 # 標準偏差(母標準偏差)
xm = np.random.normal(loc=smm, scale=ssm, size=sn)
sampledm = random.sample(xm.tolist(), en) #無作為抽出
ym = [ -0.5 for p in sampledm]

t, p = stats.ttest_ind(sampled, sampledm, alternative='two-sided')
#alternative=two-sided(両側検定), less(小なり片側検定), greater(大なり片側検定)
fig = plt.figure()

ax1 = fig.add_subplot(3, 1, 1)
ax2 = fig.add_subplot(3, 1, 2)
ax3 = fig.add_subplot(3, 1, 3)

ax1.hist(x, color="pink")
ax1.axvline(np.mean(sampled),c="r")
ax1.text(np.mean(sampled), sn/5, " $\mu_\mathrm{f}$ = " + "{:.1f}".format(sm))

e2 = patches.Ellipse(xy=(np.mean(sampled), +0.5), width=np.std(sampled)*6, height=0.2, fc='pink')
ax3.add_patch(e2)
ax3.axvspan(xmin=np.mean(sampled)-np.std(sampled), xmax=np.mean(sampled)+np.std(sampled), color="pink", alpha=0.3)
ax3.axvline(np.mean(sampled),c="r")
ax3.scatter(sampled,y,c="r")
ax3.text(np.mean(sampled), +0.25, " $\overline{x}_\mathrm{f}$ = " + "{:.1f}".format(np.mean(sampled)))

ax2.hist(xm,color="cyan")
ax2.axvline(np.mean(sampledm),c="b")
ax2.text(np.mean(sampledm), sn/5, " $\mu_\mathrm{m}$ = " + "{:.1f}".format(smm))

e1 = patches.Ellipse(xy=(np.mean(sampledm), -0.5), width=np.std(sampledm)*6, height=0.2, fc='cyan')
ax3.add_patch(e1)
ax3.axvspan(xmin=np.mean(sampledm)-np.std(sampledm), xmax=np.mean(sampledm)+np.std(sampledm), color="cyan", alpha=0.3)
ax3.axvline(np.mean(sampledm),c="b")
ax3.scatter(sampledm,ym,c="b")
ax3.text(np.mean(sampledm), -0.35, " $\overline{x}_\mathrm{m}$ = " + "{:.1f}".format(np.mean(sampledm)))


ax3.text(30, 0.15, "$t$ = {:.3f}".format(t))
ax3.text(30, -0.15, "$p$ = {:.3f}".format(p))

plt.show()


# ■■■ 平均値の有意差検定 ■■■

©K.Tachibana

  7 アプリの種類
種類説明
文書作成 ワープロ deepl

論文報告書、あるいはそれらの 要旨などの 文書を作成、印刷するアプリです。 13 )

表計算 数値を計算し、表や グラフなどの図表を作成するアプリです。 平均標準偏差などの統計量も計算できます。 データ の件数は 30件程度までが適切です。 それ以上の件数の場合、データベースアプリと連携して 抽出した データ を使う方が効率的です。
🔷 プレゼンテーション

講演スライドや ポスターを作成できます。 14 )

グラフィックス 図形地図写真などの 画像の作成や編集をします。
CAD Solid works * 図面
Autodesk AutoCAD Web 図面
Webページ作成 HTML editor
データベース Microsoft Access Microsoft SQL Server
動画編集
プログラミング google colab
ビジネス ・グループウェア
  • メール
  • チャット
    • Slack
  • 会議 Zoom, Teams, Meet
  • カレンダー、連絡先、名刺交換
  • SNS

アプリ には、 オペレーティングシステム (OS) 上で動く、インストールアプリと、 Webブラウザ 上で動く Webアプリがあります 15 )

アカウント を有効化して、 サービスアプリ を利用する(ログイン、ログオン、サインイン)には、 認証が必要です。

人気 プログラミング言語 は、java script、そしてpyton*と続きます。 *


  8 数・数字数値
概念種類
自然数 1,2
有理数 -1(整数、負数),0.5(小数),1/3(分数)
無理数 √2(無理数)は、根号と数字で表現されます。 π(円周率)、e(ネーピアの底)は数を表現する文字ですが、数字ではありません。
数字 算用数字 1234567890 アラビア数字、インド数字と呼び名には歴史的経緯があります。 0という数字の発明により * 、数値に桁(デジット)の概念が導入され、計算が著しく早くなりました。
漢数字 一二三壱弐参
ローマ数字 ⅠⅡⅢⅣⅤ 11世紀 商人が計算に便利な算用数字を使おうとしていたところ、 ギルドが公文書でその使用を禁止しました *
数値 数量を数字で表現
デジタル表示
3.14,6.02×1023 量を数にするには、 単位 が必要です。 ただし、 単位 は、人が決めたものなので、物理の範疇にはありません *。 数値は、数式に代入することができます。 量と量との関係を表現した物理の関係式は、人が決めた 単位 に依存しないので、 単位 を書くべきではありません。

数を数字で表現する方法として、アラビア数字による位取り記数法があります。(新 情報技術基礎p.26) コンピュータの内部では、符号付き整数、 倍精度浮動小数点数型(FP64-64bit)、などとして表現されます。

データは、思想や感情を含まないメディアにデジタル記録可能な表現です。

e-stat 平均身長・平均体重

参考文献

🏫 品質管理
q71
品質管理


QRコード
https://edu.yz.yamagata-u.ac.jp/Public/53225/53225_10.asp
名称: 教育用公開ウェブサービス
URL: 🔗 https://edu.yz.yamagata-u.ac.jp/
管理運用 山形大学 学術情報基盤センター

🎄🎂🌃🕯🎉
名称: サイバーキャンパス「鷹山」
URL: 🔗 http://amenity.yz.yamagata-u.ac.jp/
管理運用 山形大学 データベースアメニティ研究会
〒992-8510 山形県米沢市城南4丁目3-16

Copyright ©1996- 2024 Databese Amenity Laboratory of Virtual Research Institute,  Yamagata University All Rights Reserved.