🏠
| 西暦 | 出来事 |
|---|---|
| 正規分布、ド・モアブル(仏) * | |
| 中心極限定理、ラプラス(仏) | |
| ガウス分布=正規分布、ガウス(独) | |
| 1924 | 管理図、シューハート(米) |
| 1954 | 暮らしの手帖 商品テスト を掲載 |
| ◇ 1960 | SQC、デミング賞 |
|
大量生産時代
1
)
検査 重点主義 三種の神器:電気洗濯機、電気掃除機、電気冷蔵庫 |
|
| TQC | |
|
高価耐久消費財時代
2
)
工程管理重点主義 新三種の神器: クーラー、 🚂 カラーテレビ、カー( 🚂 自動車) |
|
|
新製品開発重点主義 メモリ、パソコン、液晶ディスプレイ |
|
| ◇ 1990 | ISO 9001、 ISO 14001 |
| 1995 | モノから サービスへ |
| 1999 | JABEE ( 教育のISO9000?) |
| 2001 | 家電リサイクル法(エアコン、テレビ、電気冷蔵庫、電気洗濯機) |
| 2003 | 物質化学工学科 JABEE 認定 |
| 2008? | 物質化学工学科 JABEE 解消 |
| 2018 |
JIS法改正
「日本工業規格(JIS)」 を「日本産業規格(JIS)」に。 標準化の対象であった鉱工業に、 データ 、サービス、経営管理等を追加。 |
|
↓
|
||||
| 工程管理 | → | |||
|
↓
|
||||
|
製品
(ロット)
|
← |
品質の推定、
合否判定
|
||
|
↓
|
↑ | |||
|
↓
|
||||
|
サンプル
|
||||
|
↓
|
||||
|
↓
|
||||
|
↓
|
||||
|
解析、分析
|
石炭合理化計画後、高度成長期(石油化学、電気製品)を支えます。
オイルショック後、電子部品や半導体産業を支えます。
👨🏫 日本のエネルギー革命(昭和30年代)-石炭合理化計画-
| 自然物 | 人工物 | |||
|---|---|---|---|---|
| 工芸品 | 工業製品 | |||
| 例1:道具 | さえずる小鳥 | パイプオルガン | 🚂 ピアノ | |
| 例2:食べ物 | 魚 | 回らない寿司 | カップラーメン | |
| 例3:エネルギー | 柴 | 電気、ガス、灯油 | ||
| 作り手 | なし | 職人、技能者、クリエータ |
労働者、作業者 (※設計は技術者) |
|
| 顧客 | なし | 王侯貴族、教会、富裕層 | 市民、庶民 | |
| 歴史 | なし | 産業革命 以降 | ||
| 形態 | 献上、寄進 | 販売 | ||
| 量 | ありのまま | 丹精込めてひとつ | 工場で大量生産 | |
| 品質(Q) | ありのまま | 丹精込めてひとつ | 同じ品質、 ばらつき なし | |
| コスト(C) | ただ? | 非売品? | 安く、低コスト 3 ) | |
| 納期(D) | 早く、即納(店売り) | |||
| 環境(E) | 持続可能 | 保護 | 廃棄物 | |
データとは、 論文 や 報告書 の論拠となる共有できる 情報です。
データ(data) : データム(datum)の複数形で、「論拠・ 基礎資料、 実験や観察などによって得られた事実や科学的 数値」などを意味する。「与える」意のラテン語ダーレ(dare)の受身形からでたもの。『大日本百科事典』(小学館, 1980) *
デジタル回路計で、 11円電池 の起電力を測ろうとすると表示が一定になりません。 このようなとき、11円電池 の起電力をどうやって、データにすればよいでしょうか?
アナログ回路計では、目盛りのところを人が読みます。読み取り 誤差になります。 デジタル回路系では、一定時間ごとに AD変換された数値が直接表示されます。これが数値のばらつきになります。
| 型 | 数 | プログラミング言語 | |
|---|---|---|---|
| 整数 | 整数 | Basic (Int), C(int), | |
| 単精度浮動小数点 | 実数 | Basic (Single), C(float), | |
| 倍精度浮動小数点 | 実数 | Basic (Double), C(double), Python (float) | |
| 複素数 | Python (complex) |
測定値などを表す数字のうちで、位取りを示すだけの0を除いた、意味のある数字を有効数字と言う。 たとえば、1.234g±0.012gという測定結果があり、これを 不確かさ を無視して1つの値y=1.234gとして表すことを考える。 不確かさ を考慮した値はおおむね1.222g~1.246gの範囲にあると考えられる。 4 )
このことは、測定値に限ったことではありません。 たとえば、円周率という数には、確かな値がありますが、数字で表現しようすれば、 3.14あるいは3.14159という具合に表現しなければなりません。 やはり有効数字が存在するのです。
さらにこれは10進数に限ったことではありません。 コンピュータの内部では、2進数で表現されることが多くあります。 その表現形式もさまざまです。 単精度浮動小数点や倍精度浮動小数点といった形式があるのは、そのためです 5 ) 。
倍精度浮動小数点は、実数を64ビットで表現します。 実数は無限集合です。それに対して64ビットの表現は264の有限集合です。 実数とデジタル数値を1:1対応させることはできません。 必ず量子化誤差が入ります。
| 数値 | 区分 | 細分 | 説明 |
|---|---|---|---|
| 測定値 | 系統誤差 | 反復測定において、一定のままであるか、または予測可能な変化をする測定誤差の成分。 | |
| 機械的誤差 | ノギス、天秤、メスシリンダーなど測定器の精度や 精確さ( 確度) による誤差 | ||
| 個人的誤差 | 測定者のくせによる誤差 | ||
| 理論的誤差 | 理論の省略などによる誤差 | ||
|
偶然誤差
random error |
反復測定において、予測が不可能な変化をする測定誤差の成分。 誤差論(確率・統計)の対象 | ||
| 計算値 | 計算誤差 | AD変換 、 DA変換、丸め誤差や計算精度による誤差、 数値 データの格納方式による誤差。 | |
| 設計値 |
公差
tolerance |
製品の仕様図や設計図で、基準値から許容される値。 方向が指定されてより具体的なものは許容値と呼ばれる。 | |
誤差(error)は、測定値から真値を引いた値です。特に、測定誤差と言うこともあります。 7 )
誤差が検査や測定にかかるのに対して、 公差は設計にかかります。 不適合を出さない設計をするには、研究開発段階から、公差の設計が大切です。
化学で使われる量・単位・記号 8 ) 誤差とノイズ 9 )こういう意味のある 数字 を有効数字というのであるが、有効数字が三桁というのは、例えば56.2とか7.31とかいう数である。数字で書いて見ると三桁位のものは極めて簡単な数で、小学校の三年生位ならば楽々と取り扱える程度のものである。ところが物理の方では三桁目まで精確な測定値が得られれば、大抵の場合には、それで先ず充分に精密な測定と思って差支えない。そして普通の物理的性質は、それ位の 精度 で分れば、それで充分に壮麗な物理学の殿堂を築き上げる材料として採用することが出来るのである。
もっとも三桁というのは、一般の場合であって、精密な 物理の測定では四桁も五桁もちゃんと測定がなされていることもしばしばある。こういう場合に意味のある数字を一桁増すことは、誤差を更に十分の一に縮めることであって、実は非常に骨の折れる仕事なのである。 学生実験の報告書とか、 独逸の学位論文の或るものとかを見ると、六桁位の数字が平気で沢山並んでいることがあるが、そういうものは大抵は、計算の途中に割算で沢山桁数を出したもので、此処ここでは問題とするまでもないものである。本当の意味で有効数字が六桁も並んでいる測定があったら、その数字には正に脱帽して接すべきである。
……(途中略)……
最後に、全く役には立たないが、ちょっと面白い一つの考察がある。 それは大抵の物理的性質は、三桁位の 精度で分れば、それで充分であるということと、人智の極致をつくした精密な測定が、殆んど例外なく六桁で止っているということである。 即ち観測の精度には、三桁と六桁とに何か意味があるらしく思われるのである。 もっとも六桁の方は前に注意した人もあって、10-6というのが極めて広い意味での 物理恒数であるというような珍説を出した人もある。 普通の物理は三桁程度というのは、それに輪をかけた迷説で、自分の実験の技術の程度を言っているのかも知れないが、その程度でも物理で生活が出来るところを見ると、何か意味があるらしくも思われるのである。
中谷宇吉郎、地球の丸い話より
| 用語 | 定義 | 備考 |
|---|---|---|
|
|
||
|
|
反復測定において、予測が不可能な変化をする測定誤差の成分 | |
|
|
反復測定において、一定のままであるかまたは予測可能な変化をする測定誤差の成分 | |
|
|
測定値がそろっていあいこと。また、ふぞろいの程度。 | 偶然誤差とほぼ同義。 |
|
|
測定値の期待値と真値の差 | 系統誤差とほぼ同義。 |
|
|
測定値に付随する、合理的に測定対象量にむすびづけられる値の広がりを特徴づけるパラメータ | 知識の曖昧さも含む |
|
|
同一の測定対象量に対する測定を複数回行うこと | 測定条件が同一かどうかによらない。 実験計画法では、ブロック単位での実験を指す。 |
|
|
同一の測定対象量に対する測定手順、オペレータ、操作条件、場所が同一の、短期間での測定の反復 | 操作条件は、因子。繰り返し数は、標本数に相当する。 |
|
|
測定の再現条件下での測定の精密さ | |
|
|
精度。 ばらつきの小ささを表す。 | |
|
|
確度 | |
| 測定値 | 規定された測定手順に実施によって得られる 量の 値 | 測定を反復するときは、個々の値、もしくは代表値(平均値や中央値など)のいずれも測定値と呼ぶ。 |
| 指示値 | 測定器が提示する 量の 値 |
| 年号 | 出来事 |
|---|---|
| B.C.300 | アラビア数字 |
| ◇ 16世紀 | |
| デカルト、数と図形を結び付けた解析幾何学 | |
| ニュートン、微分積分学 12 ) | |
| パスカル、フェルマーが賭博に関する研究(確率論と統計学) 13 ) | |
粉体の粒径を表すには、残留率曲線、通過率曲線、頻度分布曲線、あるいは ヒストグラムが使われます。 残留率および通過率が50%になる粒径をメジアン径、頻度分布が最大になる粒径をモード径と言います。 メジアン径やモード径は、平均粒径として使われます 14 ) 。
ある確定した確率の元で、偶然的に表れる変数を確率変数と呼ぶ。 特に、サイコロの目のような離散的な確率変数についての 確率分布を離散分布または離散確率分布と呼ぶ。 一方、実数で表される連続的な確率変数に対する 確率分布を連続分布あるいは連続確率分布と呼ぶ。
16 )
# ■■■ 分布関数と確率密度関数 ■■■ from scipy import stats import numpy as np import matplotlib.pyplot as plt import random sm = 52.2 # 平均(母平均) ss = 9.5 # 標準偏差(母標準偏差) fig = plt.figure() ax1 = fig.add_subplot(1, 2, 2) ax2 = fig.add_subplot(1, 2, 1) x = np.arange(start = sm - 3 * ss, stop = sm + 3 * ss, step = ss * 0.1) ax1.plot(x, stats.norm.pdf(x = x, loc = sm, scale = ss)) ax2.plot(x, stats.norm.cdf(x = x, loc = sm, scale = ss)) plt.show() # ■■■ 分布関数と確率密度関数 ■■■
無限に実験を繰り返すことはできません。 実験や測定は有限回ですから、測定は、標本調査になります。 少なくともn=3ないと、自由度不足から、統計的手法は使えません。
非破壊試験では、全数調査もできますが、 破壊試験では、商品をダメにしてしまいますから、必然的に、標本調査(抜き取り試験)になります。
| 種類 | 説明 | サイズ | 例 |
|---|---|---|---|
| データ | 単レコード | 紙 | |
| データベース | 1000~10億レコード | 内部ストレージ クラウド | |
| データリボジトリ | クラウド * データのオープンアクセスを目指す | ||
| ビッグデータ | それ以上 | クラウド |
ビッグデータは、人間では処理できず、コンピュータの助けを借りて処理するデジタルデータの集合です。 コンピュータの助けを借りるには、数学や プログラミング言語のスキルが必須です。数学は、特に集合論、代数、確率統計などのスキルが要求されます。
ビッグデータは、クラウド上に電子的あるいは磁気的な方法で 記録されており、すべてを紙に印刷することは不可能です。 つまり、すべてを見た人は、誰もいないということです。
人は、コンピュータの助けを借りて、ビッグデータの一部を選択して抽出したり(検索)、全体の傾向を抽象化してみたり(統計)することになります。 それを見て、はじめて人は、意思決定し、行動を起こします。
言い換えれば、ビッグデータは、そのままでは、 情報 ではありません。人がコンピュータにプログラムを与え、ビッグデータを処理してはじめて、人に有用な 情報 になるのです。
*確率分布 の代表値と用いられる値の一つに、確率変数の
期待値 がある。σxiP(x)∫xiP(x)母集団を ある 確率分布 で表したとき、その 確率分布 に従う 確率変数の
期待値 をその母集団の 母平均 と呼ぶ。18 )
| 種類 | 例 | 説明 |
|---|---|---|
| 文書作成 ワープロ |
|
|
| 表計算 | 数値を計算し、 表 や グラフなどの図表を作成するアプリです。 平均、 標準偏差などの統計量も計算できます。 データ の件数は 30件程度までが適切です。 それ以上の件数の場合、データベースアプリと連携して 抽出した データ を使う方が効率的です。 | |
| 👨🏫 プレゼンテーション |
|
|
| グラフィックス |
|
図形、 地図や 写真などの 画像の作成や編集をします。 |
| CAD | Solid works * | 図面 |
| Autodesk AutoCAD Web | 図面 | |
| 生成AI | Chat GPT Gemini | 文章や 画像の生成をします。 |
| Webページ作成 | HTML editor | |
| データベース | Microsoft Access Microsoft SQL Server | |
| 動画編集 | ||
| 👨🏫 プログラミング |
|
|
| ビジネス ・グループウェア |
|
アプリ には、 オペレーティングシステム (OS) 上で動く、インストールアプリと、 Webブラウザ 上で動く Webアプリがあります 21 ) 。
| アプリ& 言語 | プログラム例 | ||
|---|---|---|---|
| SQL * | NEWID()を使って、乱数を生成し、ソートして上位をとる。 select top(1) * from contents order by NEWID() | ||
| Python * | randomモジュールのsampleメソッドを使う。 | ||
| offce365 /Excel * | セルにRAND()を使って、乱数を生成し、ソートして上位をとる。 基本的にはSQLと同じ考え方。 Excel のような 表計算アプリの中で、無作為抽出をするのは現実的ではなく、 予めデータベースで抽出すると良い。 |
母集団から標本を抜き取るときに、公平でないと母集団の平均値やばたつきを正しく推測できません 22 ) 。 試料採取(サンプリング)で、もっとも簡便なのは、 一様乱数 を使った単純ランダムサンプリングです。
人数、個体数のような母集団が数えられる離散集合でも、混塊混合物、液体、気体面状態のような(バルクマテリアル)数えられない離散集合でも、 単純ランダムサンプリングが簡便です。
単純ランダムサンプリングでは、母集団に番号(ID)をつけ、一様乱数で標本を決めます。 乱数の発生は、予測不可能でなくてはならず、高度な数学的技術が要求されます。 クレジットカードの番号のようなセキュリティに関わるところでは、乱数の発生技術そのものがセキュリティの対象です。
| 要素 | 数式 | プログラミング言語 | |
|---|---|---|---|
| C | python | ||
| 変数 |
public double x; |
||
| 関数 |
double f(double x); |
||
| 関数と従属変数 |
double f(double x) {
return y;
}
|
||
| 定義域 |
|
C では、VBのselect構文のように switch構文では、定義域を指定することはできません。 結局if構文をネストさせることになります。 |
python
では、switch構文はありませんが、
elif構文でネストさせずに定義域を指定できます。
if x == 0:
print('0')
elif x < 0:
print('負')
elif x > 1:
print('正')
else:
print('発散')
|
| 和 |
for ( i = 1; i < n; i ++ ) {
s += k[i];
}
|
for i in range(1, n): s = s + k[i]* |
|
Phthon (パイソン)は、多様なデータ構造が組み込まれているので、データ処理しやすい言語仕様です。 Anaconda(アナコンダ)や、Google Colaboratoyなどの開発環境があります。 Phthonには、数値計算ライブラリNumPyがあります。 NumPyは、CやふFORTRANで、実装されていて、高速で実行できます。 ほかにも、Matplotlib(グラフ描画ライブラリ) pandas(データ分析ライブラリ) TensorFlow(機械学習ライブラリ) OpenCV(画像処理ライブラリ) など便利なライブラリが多数あります。
| 名称 | グラフ | 説明 |
|---|---|---|
| 指数関数 |
|
python
+
matplotlib
|
| 逆ネルンスト |
|
電池の充放電曲線で現れます。 |
| 確率曲線 |
|
|
| 正規分布関数 |
|
確率統計で多用されます。 品質管理 でも大切です。 |
| 概念 | 種類 | 例 | |
|---|---|---|---|
| 数 | 自然数 | 1,2 | |
| 有理数 | -1(整数、負数),0.5(小数),1/3(分数) | ||
| 無理数 | √2(無理数)は、根号と数字で表現されます。 π(円周率)、e(ネーピアの底)は数を表現する文字ですが、数字ではありません。 | ||
| 数字 | 算用数字 | 1234567890 | アラビア数字、インド数字と呼び名には歴史的経緯があります。 0という数字の発明により * 、数値に桁(デジット)の概念が導入され、計算が著しく早くなりました。 |
| 漢数字 | 一二三壱弐参 | ||
| ローマ数字 | ⅠⅡⅢⅣⅤ | 11世紀 商人が計算に便利な算用数字を使おうとしていたところ、 ギルドが公文書でその使用を禁止しました * 。 | |
| 数値 | 数量を数字で表現 (デジタル表示) |
3.14,6.02×1023 | 量を数にするには、 単位 が必要です。 ただし、 単位 は、人が決めたものなので、物理の範疇にはありません *。 数値は、 数式に代入することができます。 量と量との関係を表現した物理の 量方程式は、 人が決めた 単位 に依存しないので、 単位 を書くべきではありません。 量記号には、単位で割った数値のみを代入します。 |
数を数字で表現する方法として、アラビア数字による位取り記数法があります。(新 情報技術基礎p.26) コンピュータの内部では、符号付き整数、 倍精度浮動小数点数型(FP64-64bit)、などとして表現されます。
import numpy as np import matplotlib.pyplot as plt sm = 52.2 # 平均(母平均) ss = 9.5 # 標準偏差(母標準偏差) sn = 1000 # 母数 x = np.random.normal(loc=sm, scale=ss, size=sn) plt.hist(x) plt.show()
| 番号 | 値 | 番号 | 値 | 番号 | 値 | 番号 | 値 | 番号 | 値 |
|---|---|---|---|---|---|---|---|---|---|
| 1 | 50.13 | 2 | 43.91 | 3 | 41.23 | 4 | 47.54 | 5 | 48.06 |
| 6 | 63.71 | 7 | 40.80 | 8 | 52.30 | 9 | 46.00 | 10 | 29.74 |
| 11 | 43.91 | 12 | 61.48 | 13 | 50.48 | 14 | 58.56 | 15 | 59.45 |
| 16 | 48.38 | 17 | 44.82 | 18 | 45.66 | 19 | 39.05 | 20 | 63.98 |
| 21 | 71.76 | 22 | 57.52 | 23 | 65.88 | 24 | 52.06 | 25 | 59.08 |
| 26 | 56.45 | 27 | 63.12 | 28 | 76.40 | 29 | 55.65 | 30 | 64.16 |
| 31 | 42.46 | 32 | 63.56 | 33 | 43.07 | 34 | 60.83 | 35 | 38.70 |
| 36 | 50.48 | 37 | 44.63 | 38 | 51.40 | 39 | 59.22 | 40 | 52.54 |
| 41 | 44.50 | 42 | 44.32 | 43 | 47.97 | 44 | 52.98 | 45 | 62.97 |
| 46 | 39.61 | 47 | 51.25 | 48 | 41.07 | 49 | 53.90 | 50 | 55.09 |
| 51 | 53.38 | 52 | 45.24 | 53 | 54.87 | 54 | 48.74 | 55 | 43.32 |
| 56 | 37.32 | 57 | 52.09 | 58 | 29.21 | 59 | 42.38 | 60 | 60.82 |
| 61 | 52.79 | 62 | 61.71 | 63 | 48.94 | 64 | 51.86 | 65 | 68.55 |
| 66 | 56.64 | 67 | 58.93 | 68 | 40.90 | 69 | 50.55 | 70 | 46.55 |
| 71 | 57.96 | 72 | 40.54 | 73 | 33.19 | 74 | 50.16 | 75 | 55.87 |
| 76 | 44.09 | 77 | 57.97 | 78 | 50.71 | 79 | 63.96 | 80 | 55.24 |
| 81 | 59.79 | 82 | 65.66 | 83 | 49.79 | 84 | 50.15 | 85 | 55.48 |
| 86 | 39.92 | 87 | 67.23 | 88 | 43.69 | 89 | 48.25 | 90 | 45.11 |
| 91 | 38.28 | 92 | 56.14 | 93 | 35.88 | 94 | 51.54 | 95 | 47.51 |
| 96 | 55.62 | 97 | 50.56 | 98 | 57.75 | 99 | 48.16 | 100 | 51.96 |
import numpy as np import matplotlib.pyplot as plt import random sm = 52.2 # 平均(母平均) ss = 9.5 # 標準偏差(母標準偏差) sn = 10000 # 母数 en = 5 # 標本数 x = np.random.normal(loc=sm, scale=ss, size=sn) sampled = random.sample(x.tolist(), en) #無作為抽出 fig = plt.figure() ax1 = fig.add_subplot(2, 1, 1) ax2 = fig.add_subplot(2, 1, 2) ax1.hist(x) ax2.hist(sampled) plt.show() average1 = np.mean(x) stdev1 = np.std(x) average2 = np.mean(sampled) stdev2 = np.std(sampled) print('inf',sm,ss) print(sn,average1,stdev1) print(en,average2,stdev2)
| 種類 | 分布 | 例 | ||
|---|---|---|---|---|
| 連続分布 | 🖱 正規分布 | |||
| t-分布 | 母平均 の区間推定、 母平均の有意差検定 25 ) (t検定) | |||
|
|
標本標準偏差s | |||
| F-分布 | 分散の比、 母分散の有意差検定(F検定) 26 ) 実験計画法 分散分析 | |||
| 一様分布 | 一様乱数 | |||
| 対称三角分布 | ||||
| ワイブル分布 | ||||
| 離散分布 | 超幾何分布 | |||
| 2項分布 | ||||
| ポアソン分布 | ||||
| 物性 | 粒度分布 | |||
| 力学 | ボルツマン分布 | マクスウェルボルツマン統計。 古典統計。気体の分子運動。 | ||
| フェルミ分布 | フェルミディラック統計。 量子力学。電子の統計。 | |||
| ボーズ分布 | ボーズアインシュタイン統計。 光子の統計。絶対零度のヘリウム(超流動)の統計。超電導状態のクーパー対の統計。 |
偶然に現れる変数を確率変数と言います。 確率変数がどのような確率で現れるかを表現したものを確率分布といいます。
TRPG クトゥルフWEBダイス