10.品質管理

科学の方法において、目的とする仮説の検証をするとき、比較の対照となる基準を、コントロールとかブランクとか言います。

コントロール群（対照群）と「処理（治療）群」で効果の有意差を検定するときは、独立変数をコントロールし、未知の要因はランダム化します。

薬理効果の場合は、プラセボ効果もランダム化します。また、二重盲検によって実験者もランダム化します。

数学と数値計算

プログラミング言語

種類	分類	言語	特徴

インタプリタ	Webアプリ	JavaScript	Webブラウザ上で動作（クライアントサイド）
	Webアプリ	vb script(vbs,vba,asp) ^1 )	1964 開発キーボードとディスプレイが必要
	AI Webアプリ	python （パイソン） ^2 ) *	ビッグデータデータサイエンス * 、マテリアルズインフォマティクス *、ＡＩ
	教育	Scratch	ビジュアルプログラミング
コンパイル	OS	C ^3 )	ポインタ、構造体
	汎用	VB.NET	オブジェクト指向（多重継承なし）
	汎用	Kotlin	アンドロイドアプリ向け
	OS	C++	オブジェクト指向

colab jupyter

ファイルベースのシステムでは、コンパイラ言語は実行可能なファイルを生成し、インタプリタ言語はそれを生成しないという違いがありました。しかし、クラウドベースになって、実行ファイルそのものをクライアントにダウンロードしなくなり、ジャストインコンパイルで実行結果だけを利用するようになるとコンパイラ言語とインタプリタ言語の違いは、あまり本質的でなくなりました。

科学技術用の伝統的な言語としては、FORTRANがあります。 FORTRAN系列の言語としては、BASIC、pythonがあります。統計用言語としてRがあります。

アルゴリズム重視の伝統的な言語としてALGOLがあります。 ALGOLは、Pascal, C, C++, C#,java, javascript, typescript, Kotlinと進化してきました。 juliaはCに迫る計算速度を誇ります。

サーバーサイドで使われてきたPerlや Ruby もクラウドで利用できるようになってきました。

人工知能で伝統的な言語Lispは、F#、 Schemeもクラウドで利用できるようになってきました。

人気プログラミング言語は、java script、そしてpython*と続きます。 *

体重

表 3 . 21才女性の体重データの例
番号	値	番号	値	番号	値	番号	値	番号	値

1	54.17	2	49.61	3	47.75	4	62.19	5	45.64
6	53.86	7	44.59	8	38.15	9	52.09	10	51.24
11	44.26	12	49.84	13	50.05	14	47.77	15	46.76
16	66.43	17	57.94	18	48.37	19	52.99	20	59.95
21	46.90	22	63.52	23	44.22	24	51.30	25	41.72
26	56.23	27	52.19	28	53.14	29	46.56	30	36.67
31	51.33	32	62.94	33	53.53	34	64.41	35	50.54
36	57.74	37	60.41	38	40.98	39	39.59	40	62.91
41	31.51	42	49.57	43	60.54	44	52.98	45	71.53
46	66.35	47	54.82	48	49.66	49	49.41	50	48.24
51	38.46	52	36.13	53	63.62	54	41.73	55	42.84
56	47.98	57	28.55	58	42.14	59	53.63	60	36.79
61	62.28	62	57.59	63	58.73	64	52.76	65	75.37
66	66.82	67	50.68	68	50.79	69	55.71	70	52.43
71	46.59	72	53.36	73	44.39	74	58.23	75	47.55
76	34.93	77	56.68	78	51.14	79	53.62	80	46.85
81	45.39	82	66.19	83	60.41	84	47.58	85	46.62
86	43.62	87	33.75	88	52.99	89	69.25	90	53.94
91	60.01	92	62.74	93	47.71	94	42.68	95	62.29
96	48.52	97	52.94	98	54.02	99	46.86	100	38.48

表 4 . 統計量
項目	全数検査（母集団）	抜き取り検査（標本）

数	母数n=100	標本数=8
平均	母平均 $μ$ =51.39	標本平均= $\overline{x}$ 46.87
標準偏差	母標準偏差 $σ$ =9.02	標本標準偏差 $s$ =4.89
分散(Variance)	母分散 $σ^{2}$ =81.30	不偏分散 $s^{2}$ =23.90
偏差平方和	$S$ =5,139.46	$S$ =374.94

標本標準偏差は、母標準偏差の不偏推定量ではないが、母標準偏差の推定は、近似的に標本標準偏差で行うことが多い ^4

) ^5

) 。

平均

表 5 . 平均

アプリ＆言語	プログラム例
アプリ＆言語	母平均 $μ$	標本平均 $\overline{x}$

SQL *	select AVG(price) from products
Python *	average = statistics.mean(data) average = np.mean(data)
Google sheet *	E3= AVERAGE(B3:D3) E4= AVERAGEA(B3:D3)
Excel *	E3= AVERAGE(B3:D3)

母平均はギリシャ文字の $μ$ で表し、標本平均は、ラテン文字（ローマ字、アルファベット）のxにバーをつけた $\overline{x}$ で、表現することが多いです。

算術平均のほかに、調整平均（トリム平均）も使われます。 ^6

) ^7

)

標準偏差

表 6 . 標準偏差

アプリ＆言語	プログラム例
アプリ＆言語	母標準偏差 $σ$	標本標準偏差 $s$

SQL * *	select STDEVP(price) from products	select STDEV(price) from products
Python ^8 ) *	print(np.std(df.Age))	print(np.std(df.Age, ddof=1)) std = statistics.stdev(data) *
Google sheet *	=STDEVP()	=STDEV()
Excel *	=STDEV.P() =STDEVP()	=STDEV.S() =STDEV()

母標準偏差はギリシャ文字の $σ$ で表し、標本平均は、ラテン文字（ローマ字、アルファベット）の $s$ で、表現することが多いです。

^9

) ^10

) ^11

)

正規乱数のヒストグラムと、そこから無作為抽出されたヒストグラム

図 1 . 正規乱数のヒストグラムと、そこから無作為抽出されたヒストグラム

©K.Tachibana

確率分布

正規乱数のヒストグラムと、そこから無作為抽出されたヒストグラムム

import numpy as np
import matplotlib.pyplot as plt
import random

sm = 52.2 # 平均（母平均）
ss = 9.5 # 標準偏差（母標準偏差）
sn = 10000 # 母数
en = 5 # 標本数
x = np.random.normal(loc=sm, scale=ss, size=sn)
sampled = random.sample(x.tolist(), en) #無作為抽出

fig = plt.figure()

ax1 = fig.add_subplot(2, 1, 1)
ax2 = fig.add_subplot(2, 1, 2)

ax1.hist(x)
ax2.hist(sampled)
plt.show()

average1 = np.mean(x)
stdev1 = np.std(x)

average2 = np.mean(sampled)
stdev2 = np.std(sampled)

print('inf',sm,ss)
print(sn,average1,stdev1)
print(en,average2,stdev2)

©K.Tachibana

平均値の有意差検定（t検定）

図 2 . 母平均の有意差検定（ t 検定）

python (colab)→ png→ svg→ html ^12

)

平均値の有意差検定

# ■■■ 平均値の有意差検定 ■■■

import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as patches
import random
from scipy import stats

sm = 52.2 # 平均（母平均）
ss = 9.5 # 標準偏差（母標準偏差）
sn = 10000 # 母数
en = 5 # 標本数
x = np.random.normal(loc=sm, scale=ss, size=sn)
sampled = random.sample(x.tolist(), en) #無作為抽出
y = [ 0.5 for p in sampled]

smm = 64.8 # 平均（母平均）
ssm = 13.9 # 標準偏差（母標準偏差）
xm = np.random.normal(loc=smm, scale=ssm, size=sn)
sampledm = random.sample(xm.tolist(), en) #無作為抽出
ym = [ -0.5 for p in sampledm]

t, p = stats.ttest_ind(sampled, sampledm, alternative='two-sided')
#alternative=two-sided(両側検定), less(小なり片側検定), greater(大なり片側検定)
fig = plt.figure()

ax1 = fig.add_subplot(3, 1, 1)
ax2 = fig.add_subplot(3, 1, 2)
ax3 = fig.add_subplot(3, 1, 3)

ax1.hist(x, color="pink")
ax1.axvline(np.mean(sampled),c="r")
ax1.text(np.mean(sampled), sn/5, " $\mu_\mathrm{f}$ = " + "{:.1f}".format(sm))

e2 = patches.Ellipse(xy=(np.mean(sampled), +0.5), width=np.std(sampled)*6, height=0.2, fc='pink')
ax3.add_patch(e2)
ax3.axvspan(xmin=np.mean(sampled)-np.std(sampled), xmax=np.mean(sampled)+np.std(sampled), color="pink", alpha=0.3)
ax3.axvline(np.mean(sampled),c="r")
ax3.scatter(sampled,y,c="r")
ax3.text(np.mean(sampled), +0.25, " $\overline{x}_\mathrm{f}$ = " + "{:.1f}".format(np.mean(sampled)))

ax2.hist(xm,color="cyan")
ax2.axvline(np.mean(sampledm),c="b")
ax2.text(np.mean(sampledm), sn/5, " $\mu_\mathrm{m}$ = " + "{:.1f}".format(smm))

e1 = patches.Ellipse(xy=(np.mean(sampledm), -0.5), width=np.std(sampledm)*6, height=0.2, fc='cyan')
ax3.add_patch(e1)
ax3.axvspan(xmin=np.mean(sampledm)-np.std(sampledm), xmax=np.mean(sampledm)+np.std(sampledm), color="cyan", alpha=0.3)
ax3.axvline(np.mean(sampledm),c="b")
ax3.scatter(sampledm,ym,c="b")
ax3.text(np.mean(sampledm), -0.35, " $\overline{x}_\mathrm{m}$ = " + "{:.1f}".format(np.mean(sampledm)))


ax3.text(30, 0.15, "$t$ = {:.3f}".format(t))
ax3.text(30, -0.15, "$p$ = {:.3f}".format(p))

plt.show()


# ■■■ 平均値の有意差検定 ■■■

©K.Tachibana

アプリには、オペレーティングシステム (OS) 上で動く、インストールアプリと、 Webブラウザ上で動く Webアプリがあります ^15

) 。

アカウントを有効化して、サービスやアプリを利用する（ログイン、ログオン、サインイン）には、認証が必要です。

人気プログラミング言語は、java script、そしてpyton*と続きます。 *

表 8 . 数・数字・数値

概念	種類	例

数	自然数	1,2
	有理数	-1（整数、負数）,0.5（小数）,1/3（分数）
	無理数	√2（無理数）は、根号と数字で表現されます。 π（円周率）、e（ネーピアの底）は数を表現する文字ですが、数字ではありません。
数字	算用数字	1234567890	アラビア数字、インド数字と呼び名には歴史的経緯があります。 0という数字の発明により * 、数値に桁（デジット）の概念が導入され、計算が著しく早くなりました。
	漢数字	一二三壱弐参
	ローマ数字	ⅠⅡⅢⅣⅤ	11世紀商人が計算に便利な算用数字を使おうとしていたところ、ギルドが公文書でその使用を禁止しました * 。
数値	数量を数字で表現（デジタル表示）	3.14,6.02×10²³	量を数にするには、単位が必要です。ただし、単位は、人が決めたものなので、物理の範疇にはありません *。数値は、数式に代入することができます。量と量との関係を表現した物理の関係式は、人が決めた単位に依存しないので、単位を書くべきではありません。

数を数字で表現する方法として、アラビア数字による位取り記数法があります。（新　情報技術基礎p.26）コンピュータの内部では、符号付き整数、倍精度浮動小数点数型（FP64-64bit）、などとして表現されます。

データは、思想や感情を含まないメディアにデジタル記録可能な表現です。

e-stat 平均身長・平均体重

◇ 参考文献

🏫 品質管理

q71

品質管理

https://edu.yz.yamagata-u.ac.jp/public/53225/53225_10.asp

名称：教育用公開ウェブサービス

URL： 🔗 https://edu.yz.yamagata-u.ac.jp/

管理運用：山形大学学術情報基盤センター

🎄🎂🌃🕯🎉

名称：サイバーキャンパス「鷹山」

URL: 🔗 http://amenity.yz.yamagata-u.ac.jp/

管理運用：山形大学データベースアメニティ研究会

〒992-8510 山形県米沢市城南4丁目3-16

対象	効果の有無	誤るリスク

コントロール	効果がある	効果があるのにない誤るリスク
コントロール	効果がない	効果がないのにあると誤るリスク

種類	例	説明

文書作成ワープロ	Microsoft Word google doc deepl	論文や報告書、あるいはそれらの要旨などの文書を作成、印刷するアプリです。 ^13 )
表計算	Microsoft Excel google sheet	数値を計算し、表やグラフなどの図表を作成するアプリです。平均、標準偏差などの統計量も計算できます。データの件数は 30件程度までが適切です。それ以上の件数の場合、データベースアプリと連携して抽出したデータを使う方が効率的です。
🔷 プレゼンテーション	Microsoft Powerpoint google slide	講演スライドやポスターを作成できます。 ^14 )
グラフィックス	illustrator photo shop svgtopng gitmind mermaid	図形、地図や写真などの画像の作成や編集をします。
ＣＡＤ	Solid works *	図面
ＣＡＤ	Autodesk AutoCAD Web	図面
Ｗｅｂページ作成	HTML editor
データベース	Microsoft Access Microsoft SQL Server
動画編集
プログラミング	google colab
ビジネス・グループウェア	メールチャット Slack 会議 Zoom, Teams, Meet カレンダー、連絡先、名刺交換 SNS

◇ 平均値の区間推定－ロットアウトを防ごう－

対照実験（コントロール実験）

数学と数値計算

プログラミング言語

体重

平均