◇ データベース
データとは、 論文 や 報告書 の論拠となる共有できる 情報です。
データ(data) : データム(datum)の複数形で、「論拠・ 基礎資料、 実験や観察などによって得られた事実や科学的 数値」などを意味する。「与える」意のラテン語ダーレ(dare)の受身形からでたもの。『大日本百科事典』(小学館, 1980) *
デジタル回路計で、 11円電池 の起電力を測ろうとすると表示が一定になりません。 このようなとき、11円電池 の起電力をどうやって、データにすればよいでしょうか?
アナログ回路計では、目盛りのところを人が読みます。読み取り 誤差になります。 デジタル回路系では、一定時間ごとに AD変換された数値が直接表示されます。これが数値のばらつきになります。
種類 | 説明 | サイズ | 例 |
---|---|---|---|
データ | 単レコード | 紙 | |
データベース | 1000~10億レコード | 内部ストレージ クラウド | |
データリボジトリ | クラウド * データのオープンアクセスを目指す | ||
ビッグデータ | それ以上 | クラウド |
ビッグデータは、人間では処理できず、コンピュータの助けを借りて処理するデジタルデータの集合です。 コンピュータの助けを借りるには、数学や プログラミング言語のスキルが必須です。数学は、特に集合論、代数、確率統計などのスキルが要求されます。
ビッグデータは、クラウド上に電子的あるいは磁気的な方法で 記録されており、すべてを紙に印刷することは不可能です。 つまり、すべてを見た人は、誰もいないということです。
人は、コンピュータの助けを借りて、ビッグデータの一部を選択して抽出したり(検索)、全体の傾向を抽象化してみたり(統計)することになります。 それを見て、はじめて人は、意思決定し、行動を起こします。
言い換えれば、ビッグデータは、そのままでは、 情報 ではありません。人がコンピュータにプログラムを与え、ビッグデータを処理してはじめて、人に有用な 情報 になるのです。
*データベースは、物流、ネットショップ、名簿、 在庫管理 などさまざまな業務の基幹だ。 コンピュータでは、データベースは、テーブルの集合として実装される。 テーブルは、フィールドとレコードからなる。 たとえば、化学物質のサンプルの管理をするのにデータベースを使うなら、 サンプルのテーブルとサンプルの使用履歴のテーブルが必要だ。 サンプルノテーブルには、供給元、入手日時、管理者などのフィールドが必要であり、 サンプルの使用履歴のテーブルには、サンプルID、使用者、使用日時などのフィールドが必要だ。 このようにフィールドやテーブル、あるいはその関係に名前をつけてゆく作業をデータベースの設計という。
データベースソフトウェア
Access, SQL, FileMaker
マルチユーザ環境下のデータベース
ユーザーごとの権限,同時に更新が行われても整合性が保たれる
SQL
応用例 | |||
---|---|---|---|
無作為抽出 | select top(1) * from contents order by NEWID() | ||
平均 | select AVG(price) from products |
◇ 機械学習,ディープラーニング,AI
2023年3月14日 Google、Gmailやドキュメントに生成系AI機能が追加された。 ChatGPT もとどまるところを知らない。人工知能(AI)はどこへ向かうのか?
人工知能(AI)はいろいろなジャンルがあるが、 今言われているのは、機械学習とディープラーニングと言われるもの。 ビッグデータの存在が前提となる。 ビッグデータを扱うのに配列(行列)の演算をやらないとならない。
数式 例えば数学の知識が必要となるのは、ゲーム開発や人工知能、統計学などで、とても限られています。そのため、文系でもプログラミング習得を諦める必要は全くありません。Phthon (パイソン)は、多様なデータ構造が組み込まれているので、データ処理しやすい 言語です。 Anaconda(アナコンダ)や、 Google Colaboratoy などの開発環境があります。 Phthonには、数値計算ライブラリNumPyがあります。 NumPyは、CやふFORTRANで、実装されていて、高速で実行できます。 ほかにも、Matplotlib(グラフ描画ライブラリ) pandas(データ分析ライブラリ) TensorFlow(機械学習ライブラリ) OpenCV(画像処理ライブラリ) など便利なライブラリが多数あります。
tensorflow.org 文系スーマートフォンの顔認証は,AIによって特徴を捉え,顔を判別している.産業にも活用する研究が盛んにおこなわれている. 伊藤らは,ディープラーニングを導電性高分子アルミニウム電解コンデンサの評価装置に応用することを見出し,特許の出願および発表をしえている. さらに,電子スピン共鳴法(ESR)のスペクトルの判別やカメラのお天気判別,稲の白穂,水耕栽培の水やりタイミングの判別などいくつかの応用研究を行っている. 画像の判別はディープラーニングでAIに置き換えできる.こんな時代に,ヒトは何をすべきか?コンピュータの消費電力が多くなり,地球温暖化やエネルギー需要とバランスを如何にするか? 増え続ける学習データの保存先をどこにするか?
お天気判別学習システム「ともひろくん」
ワークステーションやPCの性能向上と低価格化
2017年には,2TBで64コアの計算機が1000万円で購入できる時代となった. 市販のPCでも機械学習を動作させるために必要とされる8GBのメモリが標準で搭載される.Mathematicaにもディープラーニングの機能が追加されている.
無償機械学習ライブラリーの提供
テンソルフローやCafeなどをはじめとする無償な機械学習ライブラリーが提供される.これらによって,機械学習やニューラルネットワークの専門の研究者のみの世界から一般人も簡単にAIを使いこなせるようになる.
テンソルフロー機械学習実習システム
テンソルフローはパイソンで学習プログラムを記述できる. このシステムのコンセプトは,テンソルフローの環境整備を不要にし,さらに,短い時間でコードを書かせるかに特化ている. ウェブページからコードを入力して,登録することで,自動的に機械学習計算ノードによって,機械学習が進む.次の日には,機械学習が完了している.また,勉強する人のために,pythonのソースコードをダウンロードでき,独自に応用展開ができるようになっている. システム使い方は,AIプログラム登録ページからテンソルフローのコードとcsv形式の学習データを入力(登録)することで利用できる. 登録されたテンソルフローのコードは,バックエンドにあるいくつかの計算サーバにジョブが割り振られ,機械学習がスタートする.大規模な計算ノードではないので,気長に待っていただければ助かります. 学習の進捗状況は,テンソルフローパイソンコード一覧サイトから確認できます. 学習による誤差の値が表示されるので,その値が小さくなれば学習完了となる.(開発中の部分もあるので,バグなどがありましたら,伊藤まで教えてください.)
学生の成果物
AI実習システムを使って,受講生が作成したAIモデルの成果物を以下に示す. 2021年度,コロナ禍で在宅からの学習が強いられる中で,44件のディープラーニングの学習モデルが提案された.なお,40名中31名の学生が提出した. 2020年度は,受講生18名から,30件のディープラーニングの学習モデルが提案された.(履修者数は,33名であった.) 学長裁量経費のディープラーニングシステムを活用しようとしたが,90分の講義時間内に収めようとすると難しかったので,断念した.
大学院では,研究過程で発見した学習モデルを作り,ウェブページに画像データベースを構築し,実践的なデザインサイエンス教育を行っている.→大学院生の成果物
- ID=100, 米沢市北部小学校が雪の天気(1),それ以外(0), 学生のウェブページ, 2021年受講生
- ID=99, 米沢市北部小学校に雪があるか(1)ないか(0), 学生のウェブページ, 2021年受講生
- ID=109, 東京が夜(1),またはよる以外(0), 学生のウェブページ, 2021年受講生
- ID=61, 天気の雨の判別(雨:1, それ以外:0), 学生のウェブページ, 2020年受講生
- ID=57, 別海町の天気判別(晴れ:1,それ以外0), 学生のウェブページ, 2020年受講生
- ID=80, 浜松市の天気 晴れ(1),それ以外(0), 学生のウェブページ, 2020年受講生
- ID=141, 米沢市北部小学校が夜かそれ以外か, 学生のウェブページ, 2021年受講生
- ID=140, お天気が「晴れ(0)」または「曇り(1)」を判別するプログラム, 学生のウェブページ, 2021年受講生
- ID=132, 米沢市立北部小学校晴れ(1),晴れ以外(0), 学生のウェブページ, 2021年受講生
- ID=106, 米沢市立北部小学校が晴れ, 学生のウェブページ, 2021年受講生
- ID=131, 熱中小学校が晴れ(1)それ以外(0), 学生のウェブページ, 2021年受講生
- ID=114, singularity build tensorflow_21.02-tf2-py3.sif docker://nvcr.io/nvidia/tensorflow:21.02-tf2-py3 INFO: Starting build... Getting image source signatures Copying blob 83ee3a23efb7 done Copying blob db98fc6f11f0 done, 学生のウェブページ, 2021年受講生
- ID=136, 米沢市北部小学校 晴れなら0、雪なら1, 学生のウェブページ, 2021年受講生
- ID=121, 米沢市立北部小学校の晴れの天気が(1)、曇りの天気が(0), 学生のウェブページ, 2021年受講生
- ID=102, 米沢市北部小学校, 学生のウェブページ, 2021年受講生
- ID=119, お天気が「雨(1)」または「雨以外(0)」を判別するプログラム, 学生のウェブページ, 2021年受講生
- ID=108, お天気が「晴れ(1)」または「晴れ以外(0)」を判別するプログラム, 学生のウェブページ, 2021年受講生
- ID=101, 米沢市北部小学校が雪の天気(1)かそれ以外(0)か, 学生のウェブページ, 2021年受講生
- ID=134, 米沢市北部小学校の空が曇っていれば(1)、腫れていれば(0), 学生のウェブページ, 2021年受講生
- ID=117, 米沢市北部小学校の空が曇っていれば(1)、腫れていれば(0), 学生のウェブページ, 2021年受講生
- ID=110, 米沢市立北部小学校 雪の日(1)、または雪以外の日(0), 学生のウェブページ, 2021年受講生
- ID=107, 米沢市立北部小学校が雪の天気(1),それ以外(2), 学生のウェブページ, 2021年受講生
- ID=123, 埼玉大学教育学部附属小学校の晴れ(1)か晴れ以外(0), 学生のウェブページ, 2021年受講生
- ID=137, 新地町立尚英中学校、天気が「晴れ(1)」または「晴れ以外(0)」, 学生のウェブページ, 2021年受講生
- ID=105, Hokubu Elementary School, Yonezawa, Yamagata Clear weather: true(1) false(0), 学生のウェブページ, 2021年受講生
- ID=124, 山形県米沢市立北部小学校が晴れの天気(1)、それ以外の天気(0), 学生のウェブページ, 2021年受講生
- ID=122, 札幌が晴れ(1)、晴れ以外(2), 学生のウェブページ, 2021年受講生
- ID=135, 那覇市で朝焼け(0)夜景(1)夕焼け(2), 学生のウェブページ, 2021年受講生
- ID=127, 雪(1) 晴れ(0), 学生のウェブページ, 2021年受講生
- ID=120, 札幌市立伏見小学校の晴れ(1) か 晴れ以外か(2), 学生のウェブページ, 2021年受講生
- ID=128, 雪(1) 晴れ(0), 学生のウェブページ, 2021年受講生
- ID=126, 雪(1) 晴れ(0), 学生のウェブページ, 2021年受講生
- ID=103, 米沢市立北部小学校 雪の日(1)、雪以外の日(0), 学生のウェブページ, 2021年受講生
- ID=104, 米沢市立北部小学校 雪の日(1)、雪以外の日(0), 学生のウェブページ, 2021年受講生
- ID=139, 米沢市立北部小学校晴れ(1)、晴れ以外(0), 学生のウェブページ, 2021年受講生
- ID=142, 米沢市立北部小学校晴れ(1)と晴れ以外(0), 学生のウェブページ, 2021年受講生
- ID=133, 晴れ(1) 晴れ以外(0), 学生のウェブページ, 2021年受講生
- ID=138, , 学生のウェブページ, 2021年受講生
- ID=116, 米沢市北部小の天気 晴れ(1)、それ以外(2), 学生のウェブページ, 2021年受講生
- ID=125, 札幌の天気が「晴れ(0)」または「晴れ以外(1)」を判別するプログラム, 学生のウェブページ, 2021年受講生
- ID=130, 米沢市立北部小学校天気雪(1)または雪以外(2), 学生のウェブページ, 2021年受講生
- ID=129, , 学生のウェブページ, 2021年受講生
- ID=113, 米沢が晴れ(0),晴れ以外(1), 学生のウェブページ, 2021年受講生
- ID=112, 米沢が雪が降っている(1)、降っていない(2), 学生のウェブページ, 2021年受講生
- ID=118, 米沢が晴れ(1) , または晴れ以外(0), 学生のウェブページ, 2021年受講生
- ID=115, 米沢が夜(1)、またはよる以外(0), 学生のウェブページ, 2021年受講生
- ID=111, 米沢 晴れか雪か, 学生のウェブページ, 2021年受講生
- ID=83, 天気判別, 学生のウェブページ, 2020年受講生
- ID=75, 0は雨以外,1は雨, 学生のウェブページ, 2020年受講生
- ID=65, 天気の雨の判別(雨: 1とする), 学生のウェブページ, 2020年受講生
ディープラーニングの原理
ディープラーニングは,行列で表現される.2年生の前期の授業ということであり,数学の詳細は触れないが,学習モデルの設計が重要である.例えば,レモンであると,それ以外の2つのシンプルなモデルを作り,その教師データの質を高め学習されるかに,かかっている.
関連講義・参考書
- 鈴木 健一,吉田 一義,松林 総,松林 総,立花 和宏,伊藤 智博,電極体、評価装置及び評価方法, 特開2018-142705(P2018-142705A).
- 数学 II(線型代数学),コーシー・シュワルツの不等式シラバス
- 大石進一著、フーリエ解析、コーシー・シュワルツの不等式, p.110(総ページ数 218), 1994年, ISBN4-00-007776-7,岩波書店
- 寺田交行著、線形代数、総ページ数 136, 1993年, ISBN4-7819-0123-9,サイエンス社
- 涌井良幸, 涌井貞美著、ディープラーニングがわかる数学入門 、総ページ数 239, 2017年, ISBN978-4-7741-8814-0,技術評論社
- Mark Lutz著,夏目大訳、初めてのPython 第3版 、総ページ数 768, 2009年, ISBN978-4-87311-393-7,オーライリー・ジャパン
- 斎藤康毅著、ゼロから作るDeep Learning Pythonで学ぶディープラーニングの理論と実装 、総ページ数 298, 2016年, ISBN978-4-87311-758-4,オーライリー・ジャパン
【演習】AI実習 -判別学習モデルの作成と教師データ
ディープラーニングの学習モデルの作成と教師データを作成し,ディープラーニングを学習させてみましょう. テーマは,お天気判別システムです.ウチダの「IoT百葉箱」を画像データを使って,教師データを作成してください.
- 1.判別学習モデルの決定
- 判別学習モデルを決めます。例としては、
お天気が晴れ(1),それ以外(0)
や,お天気が雨(1),それ以外(0)
である。 - 2.csv形式の教師データファイルの作成
-
csvファイルの形式は、画像URL,意味です。CVSファイルのコンマを区切りにして、左側に画像のURL,右側に判別学習モデルの意味である1または0を記述している。
IoT百葉箱の画像データベースは,http://iot100.uchida.co.jp/のURLから閲覧できる。
この画像データベースを使ってCSVファイルを準備してください。
http://iot100.uchida.co.jp/iot100api/public/getscene/74/1/original/201804220740,1 http://iot100.uchida.co.jp/iot100api/public/getscene/74/1/original/201804260540,0 http://iot100.uchida.co.jp/iot100api/public/getscene/74/1/original/201804240710,0 (中略) http://iot100.uchida.co.jp/iot100api/public/getscene/74/1/original/201805170730,0 http://iot100.uchida.co.jp/iot100api/public/getscene/74/1/original/201806300800,1 http://iot100.uchida.co.jp/iot100api/public/getscene/74/1/original/201804020500,1
- 3.コードとcsvファイルのウェブ入力
-
AIプログラム登録ページ(https://b.yamagata-u.ac.jp/amenity/Laboratory/DeepLearning/TensorflowCodeForm.aspx)で判別学習モデルの名称(キャプション)と教師データのCSVファイルの内容を登録してください.
本学以外の方は,https://a.yamagata-u.ac.jp/amenity/Laboratory/DeepLearning/TensorflowCodeForm.aspxのページで,pythonのソースコードジェネレータを体験できます.
- 4.学習結果の確認(学習完了まで1週間待ち)
- 画像判別の確認サイトで任意の画像について判別を試みる。
コラム
アフィン変換と行列,GPU
GPUはアフィン変換アクセラレータ!
アフィン変換とは、図形を回転させたり引き延ばしたりする変換のこと。線の図形の移動を考えてみよう。 の式をy軸方向に2移動したら、どうなるかなぁ。
, を代入して、 とし、線を移動するだろう。
行列で表現してみよう。
と表せる。
次元を1つ上げた3次元の座標系にすると、
と表せる。
ディープラーニングの原理の図を見ると行列の計算を沢山やっている。ディープラーニングで、GPUサーバが利用されるのは、GPUがグラフィック計算に特化し、行列計算が得意な計算ユニット! AIデザイン教育推進センターにGPUを沢山搭載した計算機が導入された。 多額の税金が投入されたもの。ぜひ、この機会に、使えるだけ使ってください。使い方は、AIデザイン教育推進センターをご覧ください。
2021.6.29に,WebClass のAIデザイン教育研究推進センター掲示板
に,各種マニュアルやサンプルプログラムを掲載したそうです.
WebClassのコースに,AIデザイン教育研究推進センター掲示板
を追加して,ディープラーニングシステムを使ってみてください.
ディープラーニングシステムでコンテナのビルド
ディープラーニングシステムではコンテナを使って機械学習のプロセスを実行するようである. コンテナエンジンとして,Dockerが有名であるが,Dockerはコンテナをビルトづるときに,root権限が必要になる. そこで,本学のディープラーニングシステムでは,singularityエンジンを使って,root権限がなくてもビルドできるようになっている. その一例を下記に示す.
nvidiaのDEEP LEARNING FRAMEWORKSからDockerコンテナをダウンロードして使いたいを例として説明する.
https://docs.nvidia.com/deeplearning/frameworks/tensorflow-release-notes/running.html#runningにアクセスし,dockerのpullコマンドを確認する.
2021/3/17では,docker pull nvcr.io/nvidia/tensorflow:21.02-tf2-py3
が最新版をDockerで取得するときのコマンドである.
singularityでは,singularity build filename.sif docker://
の後に,nvcr.io/nvidia/tensorflow:21.02-tf2-py3
の部分の追記することで,singularityのコンテナイメージファイルを作成できる.
具体的には下記のようなコマンドを入力する.
singularity build tensorflow_21.02-tf2-py3.sif docker://nvcr.io/nvidia/tensorflow:21.02-tf2-py3 INFO: Starting build... Getting image source signatures Copying blob 83ee3a23efb7 done Copying blob db98fc6f11f0 done
コンテナイメージの動作確認は,下記のようなコマンドでできる.
singularity shelltensorflow_21.02-tf2-py3.sif Singularity> date Wed Mar 17 17:48:14 JST 2021 Singularity>
関連リンク
- 1. 静岡市登呂博物館,トロベーのとろはくガイド(静岡市登呂博物館ガイドブック),静岡市登呂博物館,稲作の来た道(2015)
- 2. 財団法人 紙の博物館,紙の博物館収蔵品,財団法人 紙の博物館,日本の手漉き紙(2000)
- 3. 傳益瑤,芭蕉「生命の賛歌」,亀井文蔵,松尾芭蕉『奥の細道』全文, 20(2003)
- 4. ,液晶ディスプレイ
- 5. ,フラッシュメモリ
- 6. ,液晶ディスプレイ
- 7. ,発光ダイオード
- 8. 堀桂太郎、ほか9名,工業情報数理,実教出版,9.3.1. 電子文書(2022)
- 9. 堀桂太郎、ほか9名,工業情報数理,実教出版,プレゼンテーション支援ソフトウェア(2022)
- 10. 堀桂太郎、ほか9名,工業情報数理,実教出版,2.3. アプリケーションソフトウェア(2023)
- 1 . ◇ 情報機器の購入からリサイクルまで~Chrome bookに至る歴史~
-
2
.
◇
データ通信技術からスマートグリッドまで~ライフラインとインターネット~
- IP電話、光電話、携帯電話、通信キャリア、回線、プロバイダ
- 山形大学の無線LAN
- テレワークと遠隔授業
-
SIMフリー、データローミング
0036 0033 0077 0088
- 電力自由化とスマートメーター
- プロバイダの選択と契約まで-未成年の契約-
- 情報技術とコミュニケーション-電信、電話、メール、SNS,電子会議システム、電子書籍、電子出版-
- 関連講義:直交とウォルシュ関数、偶と奇関数, 数学<桑名先生
- 3 . ◇ 検索エンジンから特許電子出願まで~DNA配列は特許になるか?~
-
4
.
◇
個人認証から電子決済まで~フィンテックとセキュリティ~
- 個人特定ツールとしての電子メールと携帯電話番号
- 住民基本台帳とマイナンバー
- インターネットバンキング
- 電子マネーとクレジットカード、ネットショッピング
- フィンテック-資産管理アプリと家計簿アプリ-
- 確定申告
- 関連講義:行列と整数論, 数学<桑名先生
-
5
.
◇
ホームページの仕組みと応用-受講成果を公開しよう-
ホームページに公開するとき amenity
-
6
.
◇
化学式ワープロと分子軌道計算~量子力学もコンピュータで解こう~
- 点群と空間群-結晶構造
- 分子軌道とHOMO、LUMO、電子密度
- 反応経路探索
- 関連講義:直交系と行列変換, 数学<桑名先生
-
7
.
🔷
テキストファイルを変換しよう~spread sheetとjava script~
- 数理処理とデータのグラフ化
- クラウドとファイル
- プログラム言語 としてのjava script
- 開発プラットフォームとしてのhtml5
-
8
.
3D-CADを使った分子模型作成~計算結果を3Dプリンターへ~
- CADとCAM
- 3D-CAD
- ラピッドプロトタイピング,3D-プリンタ
-
9
.
演算処理と数式処理~微分方程式はコンピュータで解こう~
- 数式処理ソフト、 マセマティカ
- 関連講義:微分方程式の組み立てと境界条件, 数学と化学数学<桑名先生
- 10 . 🔷 汎用非線形有限要素法によるCAE~工業の現場で使われるシミュレーション~
-
11
.
オペレーティングシステムとデータベース~ビッグデータと機械学習~
~
- オペレーティングシステム
- データベース
- アプリケーション
- クラウドコンピューティグ
- ビッグデータと機械学習
- 関連講義:行列への変換、内積、確率、コーシー=シュワルツの不等式とAI, 数学<桑名先生
- 12 . 🔷 サプライチェーンマネジメントと電子マニフェスト~薬品や材料の調達・管理~
-
13
.
スマホアプリを作ってみよう~Javaとセンサ~
- センサーとロボット、IoT
- ラズベリーパイ、マイコン、アルディ-ノ
- プログラミング言語とJava
- スマホアプリの開発
- 関連講義:AD変換とディラック・デルタ関数、数学<桑名先生
-
14
.
ワープロと機械翻訳~多国語長文ドキュメント作成~
- ライセンスとアカウント
- 機械翻訳
- ドキュメンテーション
- アウトラインプロセッサとしてのワープロ
- 受講ノートの仕上げと提出
山形大学 大学院 理工学研究科
〒992-8510 山形県米沢市城南4丁目3-16
准教授 伊藤智博
0238-26-3573
http://c1.yz.yamagata-u.ac.jp/
🎄🎂🌃🕯🎉
Copyright ©1996- 2024 Databese Amenity Laboratory of Virtual Research Institute, Yamagata University All Rights Reserved.