今回の記事では、ここ近年世の中を騒がしている「DX」を検討するうえで、DXと相性の良い知っておくべきIT技術について紹介していきます。
まず世の中のITに関する新しい技術を知り、それらが自社でどう活用できそうか検討することから初めてはどうでしょう!
DXの定義や解釈について
「DX」という言葉を最近は多く見掛けますが、実は非常に抽象的な言葉であり、DXの定義について調べても統一された明確なものは見つけられません。
我々IT技術者から見ても様々な解釈や定義があり、一言で「DX」と言ってもその有様は十人十色です。
そんなDXですが、当項では私の個人的なDXに対する解釈を元にDXを定義していきます。
「DX=業務のデジタル化」ではない
DXはDigital Transformationの略称です。
Transformationは直訳すると「変形」だとか「変身」といった意味合いであり、「Digital Transformation」の単語から導き出せる意味としては、「デジタル技術を用いた変革」と扱っても良さそうです。
そのため、例えば手作業でやっていた業務に対してシステムを導入して自動化したようなケースは当然「DX」とは呼びません。
DXとして呼べるような実例としては、例えば今ではすっかり見慣れましたが、大手ファミレスチェーンでは、店員さんが注文をテーブルまで聞きに来ることはなくなり、テーブルに設置されたタブレット端末からお客様自身が注文を入力します。
昔の飲食店では店員さんがオーダーを取るのが当たり前だった常識を覆し、お客様自ら注文をする事業形態に転換にしたことで、店舗の人件費や店員の業務習得のコストを大きく削減し、現在のコロナ禍においては従業員へのウィルス感染のリスクを軽減することにも貢献しています。
また、別の事例としては、某アパレルECサイトでは、ユーザーに対して自身の体のサイズを図るためのスーツを配布し、そのスーツを着て専用のスマホアプリで計測することで、ユーザーの体のサイズのデータを取ろうとしました。
その試み自体は、そのスーツを無料配布制にしたことで、スーツの配布希望者にスーツが行き渡らなかったり、体のサイズを計測するアプリの精度の問題などで上手くはいきませんでしたが、これがもし成功していれば、その企業は自ECのユーザーの膨大な体形データを収集することになります。
その結果、自EC内で取り扱う衣料品のサイズの在庫を最適化でき、それぞれの顧客の体形に合わせた服を提案することができます。
特にECサイトにおける、服など衣料品の販売において一番ネックになるのは、欲しいと思った服の試着ができないことですが、ユーザーの体形データを取ることで、受注時に警告を出したり最適なサイズを提案することで、納品後の返品を減らすことにも繋がったでしょう。
当記事における「DX」の定義
前項で説明したように、「DX」とは単純なデジタル化や自動化といった言葉ではないのがご理解いただけたかと思います。
当記事で「DX」を語るにあたって、この記事としての「DX」の定義も決めておかなければなりません。
よって、あくまで個人的なDXの定義としては以下と考えています。
この前提に立って記事の執筆を進めてまいります。
DXに活用できそうなIT技術の紹介のその特徴
DXを導入していこうと考えた場合に、今のIT業界において、どのような技術が注目されており、それらの技術はどのように活用できるのかを理解しておく必要があります。
当項では、DXでよく用いられる技術やツール、デバイスなどを幅広く紹介していきます。
これらの知識をDX導入のヒントにしてください。
機械学習(Machine Learning)
最近は企業におけるデータをもとにした経営判断などに使われることも多くなってきた「機械学習」について紹介します。
機械学習とは、大量のデータを解析するための手法の一つであり、その解析には統計学などの高度な数学的な手法を取り入れています。
時系列を持つ過去からの大量なデータに対して、機械学習で使われる各アルゴリズムから最適なものを選定して解析することにより、過去のデータから傾向を見つけ、未来の予測ができたり、人間が気付かないようなデータ間の相関性を見つけることができます。
また、近年では各社のBIツール(データ分析用パッケージソフト)にも標準的に機械学習を用いたデータ解析を行えるようになってきており、高度な知識が無くても比較的容易に機械学習を業務に取り入れることができます。
「機械学習」でできること
機械学習を利用することで何ができるかを紹介していきます。
まず、用途として多いのは、過去のデータから将来のデータを予測する未来予測です。
例えば、過去の売上や様々なデータを元に将来発注すべき商品の発注数を機械学習から導き出すことにより、過剰発注や在庫不足を避けられます。
また、データ間の相関性を発見するのにも役立ちます。
従来のデータ集計は、人が恣意的に集計対象を絞り込んだり、使用するデータを選定したうえで集計を行います。
その集計結果を元に分析を行いますが、その場合は集計対象を選定した人の思い込みや、想定する結果になって欲しいという願望が影響された分析になることも多く、客観的な集計とは言えません。
機械学習では、データとデータの相関性を分析することもできるため、例えば人が想像していなかったデータが売上と相関性を持っているということもわかります。
また、クラスタリングというアルゴリズムでは、データを分類できます。
機械学習でできることは、使用するアルゴリズムによって変わります。
また、用途によって各アルゴリズムには向き不向きがあるため、それらを適切に選択して利用していく必要があり、実際に機械学習を適切に導入していくには、「データサイエンティスト」や「データアナリスト」と呼ばれるデータ解析の専門家の助言や指導が必要になります。
大事なのは、これまでの人間の経験や勘で判断していた様々な事象を、機械学習によって過去のデータから論理的に導き出せるようになるということです。
深層学習(Deep learning)
一般的には「深層学習」と呼ぶより、「ディープラーニング」と呼ばれる方が多いため、当項では「ディープラーニング」と呼称していきます。
ディープラーニングは、厳密には機械学習と呼ばれる分類のなかのデータ分析手法の一つです。
ただ、技術的な仕組みとしては非常に高度な処理を行います。
具体的には「ニューラルネットワーク」と呼ばれる、脳のシナプス結合を模倣した処理ノードを構築し、それらのノードは階層化、深層化(ディープ)されており、人間が学習するかのように、データを通してコンピューターに様々な対象を学ばせることができて、適切に学習をさせることで非常に高い精度で対象を判別や判断ができるようになります。
学習においては大量のデータを読み込ませる必要があり、そのデータ毎の差異や偏移などを各ノードのアルゴリズムで解析し、点数付けをしていくといった処理が動きます。
現在ディープラーニングが広く活用されている用途としては以下があります。
- 自然言語解析
- 外国語の自動翻訳
- 画像認識
- 音声認識
「AI」とは非常に広義な言葉ですが、世の中で「AI」と分類されている技術の多くは、このディープラーニングによって実現しています。
「ディープラーニング」でできること
「ディープラーニング」では、機械学習のように明確な数式を元にした出力をするのではなく、多層化されたノードで学習をしながら人間の思考のように物事を判別したり判断できるようにする技術です。
そのため、ディープラーニングで答えを導き出しす過程の処理はブラックボックス化し、導き出された答えは、その開発者でさえ論理的に説明できないケースもあります。
ただ、ディープラーニングでは、従来の条件分岐を基本としたアルゴリズムでは不可能だった複雑な判定をすることができ、適切に学習された出力結果は正確です。
また、学習したデータから最適なモデルを構築することができます。
今後人類が社会をより便利するためには欠かせない技術です。
ディープラーニングを企業の業務に活かそうとする場合は、ディープラーニングの特徴である「定量化できない物事を定量化する」部分に着目すると良いでしょう。
例えば、芸術における価値を定量化することは非常に困難です。
優れた芸術には高い金銭的な価値が付くと仮定し、世界の絵画の画像とその価格をディープラーニングで学習させることで、絵画画像をコンピューターに読み込ませることで絵画に対する適切な価格を割り出すことができるようになります。
更にディープラーニングを活用することで、大量に読み込ませた絵画の画像データから価値の高い絵画画像を自律的に生成することも出来るようになります。
音楽などでも同様の試みができます。
これまでは職人と呼ばれる技能職が経験と勘を頼りに行っていた判断は、その判断材料となる画像等の非定量化されたデータと、その判断結果をディープラーニングで学習させることで、職人ではなくコンピューターが適切に判断できるようになります。
AR/VR
見出しでは「AR/VR」として一括りして扱っておりますが、実際には異なる技術です。
この両技術の違いを混同しているケースも多々見られるため、まずは「AR」と「VR」の違いを説明していきます。
ARとは
「AR」とは「Augmented Reality」の略称であり、日本語では「拡張現実」です。
現実の世界に対してデジタルな表現を拡張します。
例えばスマートフォンなどのカメラから映し出された映像に対して、本来は実在しない人や物、空想上のキャラクターなどを配置してあたかも実在しているかのように見せるといったものがあります。
ARとして有名なサービスとしては、現在も国内にユーザーを多く抱えるスマートフォン向けゲームアプリの「ポケモン GO」があります。
また、国内では法律の規制により実現が現在難しいですが、自動車メーカーではフロントガラスに運転を支援するための映像をホログラムで投影するといった技術も開発しております。
これもARと呼べます。
ARではコンシューマー向けのサービスや製品より、企業などエンタープライズ向けへの利用の方が盛んです。
現時点でも、医療、建築、土木、物流といった様々な業界で実用化されていたり、実用化に向けての検証がされています。
また、残念なことに軍事利用でも盛んであり、様々な兵器に装着され兵士の戦闘を支援するARが開発されています。
ARの軍事利用については賛否両論がありますが、それだけARが優秀な技術であり、様々な分野で期待されている技術であるとも言えます。
VRとは
「VR」とは「Virtual Reality」の略称であり、日本語では「仮想現実」です。
コンピューターのなかで仮想的な空間を作成し、そのなかに自分の分身である「アバター」を配置して活動したり、仮想空間内であたかも自分自身がその空間に実在しているかのような体験をさせるといったものがあります。
特に最近のVRでは、ユーザーにヘッドマウントディスプレイを装着させて、視界をモニターで遮り、仮想空間に没入させるといった後者のサービスが主流です。
前述したARでは、現在のところエンタープライズ向けのサービスが主流だと説明しましたが、VRについてはコンシューマー向けのサービスが多いです。
VRの特徴として、自宅に居ながらコンサート観戦やスポーツ観戦、旅行や各種アミューズメント施設などに自身が実際に居るかのような体験ができます。
視覚はモニターで遮られ、そのモニターは右目用と左目用で分離していることで、映像は立体的に表示されます。
また、ヘッドマウントディスプレイではジャイロセンサーにより傾きを検知し、ユーザーが頭の向きを変えると、その変えた向きに連動して映像の視点も変わります。
聴覚はヘッドセットを装着することで、臨場感のある音声を楽しめます。
このような技術を駆使することで、仮想空間が実在する空間かのような体験をさせることができます。
「AR/VR」でできること
これまでの説明から、両技術は以下の特徴があると言えます。
何らかのサービスを提供したり、何らかの業務を行う上で、現実世界においては空間に関する制約が発生することが多々あります。
移動が必要だったり、天候が悪化したり、環境を用意するのが困難だったり、制約は様々です。
その様な「空間」における制約は、デジタルの世界では無視することができます。
また、デジタル空間やデジタルの融合だからこそできる映像表現や非現実的な体験は唯一無二です。
ARであれば、様々な現場作業における作業支援に、VRであれば、様々なコンテンツを仮想体験に活用できます。
IoT
「IoT」とは、「Internet of Things」の略称であり、様々な「Things=物たち」がインターネットに接続されて通信をするという考え方を表します。
これまでもパソコンなどのコンピューターがインターネットと通信することは当たり前に行われていますが、パソコンやスマートフォンといったデバイス以外にも、これまでオフラインが当たり前だった製品にもどんどんとインターネットに接続する機能が追加されています。
例えば、家庭で使用する電化製品。
電気ポットで給湯したデータをインターネットに送ることで、離れて暮らすお年寄りの安否を確認したり、ネットワーク接続したコンセントのプラグ(スマートプラグ)に対してインターネットを介して電源のオンオフを制御するなど、現在も様々なIoT家電か新しく販売されていっています。
また、一般家庭を対象としたコンシューマー向け製品だけではなく、企業のオフィスや工場などで使用するエンタープライズ向け製品においても、IoTは盛んに導入されています。
トナーカートリッジの残量や機器の状態のデータを自動的にメーカーに送信し、トナーが減ってきたら自動的にトナーを発送してくれて、機器の異常を検出すれば、メーカーの保守作業員が自動的に駆け付けてきてくれる複合機。
このような利用が広がりつつあります。
「IoT」でできること
IoTには現在でも様々なものに利用されていますが、例えば今後期待できそうな活用用途としては、工作機械。
製造業では、オートメーション化が進み、様々な製品を産業ロボットが生産していますが、なかには機械化ができず、個人の経験や技能でしか行えない特殊な作業、難易度の高い作業もあります。
所謂「職人技」です。
そのようなケースでも、その作業者にIoTに対応した工具を持たせて、作業における様々な要素のデータを取得します。
工具の握り具合、動かし方、向きや角度、力の入れ具合など。
それらのデータ多く収集し、適切に分析することで、これまでなら不可能だった作業を機械化したり、作業のコツといった主観的な感覚に基づく技能を数値化してデータ化することができます。
このような活用もIoTに期待されている分野になります。
ブロックチェーン
「ブロックチェーン」とは特定のデータの改ざんを防ぎつつ、分散して管理することのできる技術を指します。
ブロックチェーンの技術が使われており、最近よく耳にすることの多くなったサービスとしては、ビットコインに代表される「暗号通貨」です。
ブロックチェーンは近年のIT技術のなかでも画期的だと評される技術の一つです。
その要因の一つとしては、
これまでのデータ管理の常識として、データベースサーバーやファイルサーバーなど、データを保存する大元の環境があり、そこでデータを管理していました。
ブロックチェーンでは、データを管理するための大元のサーバーといった仕組みを使いません。
各端末が同じデータを持ち、各端末が「P2P(Peer to Peer)」と呼ばれる、お互いが直接通信をし合う方式で同期をとりながら、自律的に相互管理をする仕組みです。
そのため、大規模なデータ管理用のサーバーも必要はなく、それにより、サーバーが障害により停止してサービスが利用できなくなることもありません。
また、画期的と言われる要因の一つとしては、
通常、各端末が分散してデータを保持する場合は、端末間でデータの不整合が発生するリスクがあります。
さらに、データを保持する人がそのデータを意図的に改ざんすることも考えられます。
そういったケースの対策として、ブロックチェーンでは「ハッシュ関数」と呼ばれる技術や、それに関連した「電子署名」と呼ばれる技術をを利用して、過去の変更履歴から現在までのすべての変更の整合性を検出できる仕組みが用意されています。
それにより、現在のデータは改ざんがされておらず、欠けの無いデータだと証明することが可能です。
この二つの大きな特徴が画期的と言われる所以です。
「ブロックチェーン」でできること
現在も金融市場で取り引きされている「暗号通貨」が一番有名です。
本来通貨は、日本で言えば日銀などの中央銀行で発行し、その国内の商取引で使用されます。
ただ、国によっては民主的な運営ができていなかったり、経済状況が悪く、自国の通貨の価値が毀損されているケースもあり、自国通貨でまともに取り引きができない場合も存在します。
そんな国や地域において、中立的な第三の通貨としての役割が期待されています。
しかし、残念ながら現在の用途としては商取引における決済通貨としての価値より、投機目的での利用が大半です。
また、暗号通貨の特性上、不正な取引における決済手段としても使われている側面もあります。
このように、金融分野における活用は、若干歪ではありますが広く進んでいます。
次に活用されようとしているのは、帳簿としての機能です。
改ざんが許されない書面や帳簿としての代表的なもののひとつに、行政文書や行政の各台帳があります。
行政文書や各台帳のデータをブロックチェーンで管理することにより、行政として求められる中立性を保ちながら、改ざんや消失を防げます。
行政文書の管理や行政が管理する台帳データとは非常に相性の良い技術です。
RPA
「RPA」とは「Robotic Process Automation」の略称であり、主にパソコンの人間が行う操作を記録させたり、コンピューターに指示することで、パソコン内で実施する作業を自動化するための技術です。
近年ではRPAを利用して様々な業務を自動化している企業も多く、導入が進んでいます。
有名なRPA製品としては以下があります。
- Power Automate Desktop
- WinActor
- UiPath
- BizRobo!
近年では所謂「RPAブーム」もあり、様々な大企業がRPAを活用して大きな業務効率化を実現しニュースになりました。
これまでの業務の自動化といえば、プログラマーがプログラミング言語を使用して作業を自動化させる手段が一般的でした。
そのため、作業を自動化させるためにはプログラミング技術が必要になり、ITの初心者にとっては非常に敷居が高い行為でした。
RPAでは、プログラミングをすることなく、パソコンの特定のボタンをクリックさせたり、画面に表示しているデータを読み込むといった高度な処理をPPAソフト内に登録し、その一連の処理をまとめて実行させることができます。
そのため、プログラミングの知識や経験を必要とせず、パソコンで行っていた様々な作業を自動化できるツールとして、大きく注目を浴びました。
「RPA」でできること
製品によって機能に差はありますが、標準的なRPA製品の機能は以下です。
- モニター画面の座標を指定したクリック操作
- ウェブ画面内の要素を指定したクリック操作や値の読み込み
- 画面の特定の位置の文字をOCR技術でテキストデータへ変換
- RPA組み込みコマンド(アクション)を組み合わせて一連の作業を自動化
- 一連の処理内では条件分岐や繰り返し処理の実装が可能
- 自動化した一連の処理をシナリオとして登録して実行
これらの機能を駆使して様々なパソコン上で行っている作業を自動化することができます。
ただ、一見すると初心者向けの技術と感じますし、習得も難しくなさそうに見えますが、実際に使いこなすにはRPA固有の知識や技術が必要になり、プログラミングが不要だから簡単といった謳い文句は適切ではありません。
RPAブームもあり、年間〇千時間の業務効率化といった刺激的な実績と併せて、各RPAベンダーがあたかも簡単に業務の自動化を行えるかのようにアピールしていますが、実際にはそれほど簡単なものではありません。
導入を検討する場合は、実際に評価用ライセンスなどで使わせてもらいながら、慎重に熟考してください。
5G通信
「5G」は「5th Generation」の意味であり、最近は国内でも導入されだした第5世代の移動通信システムを指します。
スマートフォンなどの携帯電話が通信をする技術を「移動通信システム」と呼び、現時点では4Gと呼ばれる第4世代の技術が広く使われています。
この世代が新しくなる度に使われている技術も進化し、世代交代時の大きな変化としては、通信速度がその都度飛躍的に向上してきました。
現在広く使われている4Gの最大理論値は「1Gbps」なので、実測値は無視して理論値だけで言えば、これまでの通信より10倍速いと言えます。
これほどの通信速度が実現できればモバイルデバイスの世界は大きく変わります。
ただ、現在は国内でも5Gは限られた地域のみでしか使えません。
各キャリアは5G対応をアピールしていますが、国内の殆どの地域では依然として4G(LTE)が使われています。
何故5Gが非常に限られた地域だけでしか利用できないのでしょう?
それは、5Gが非常に高い周波数(ミリ波)を使用しており、高い周波数の電波は距離による減退が大きく、通信可能な距離は短くなります。
また、直進性が強い為、遮蔽物や雨などに弱く、確実に電波を届ける為には電波の基地局を数百メートルから1キロ間隔で設置する必要があります。
それが5Gに普及におけるもっとも大きい壁になります。
ただ、それは純粋な5G通信に関する話であり、現在国内で実用化している5Gは純粋なミリ波の5Gだけではなく、Sub-6と呼ばれる、従来の4Gの周波数より少し高めの電波を使用し、純粋なミリ波と比べて低速な電波も含まれています。
そのため、現在商用利用が開始されて一部の地域で利用できる5Gは、前評判のような速度は出ません。
また移動通信システムでは、電波を使用して通信するのは基地局までであり、そこから先は電波ではなく物理的な通信回線を介してデータを伝達しますが、その経路も併せて高速化しなければ、やはり理論値のような速度は出ないと言えます。
このように、5Gによる高速インターネット通信にはいくつかの課題がありますが、それらが解決されれば、非常に可能性が広がる技術です。
「5G」でできること
5Gの通信速度は理論値として10Gbpsです。
もしこの理論値通りの通信速度が得られれば、ITの世界は大きく変わります。
例えば、オンラインストレージなどでクラウド上でデータを保管する場合でも、あたかも自端末内で保管しているのと変わらないぐらいのレスポンスでアクセスできるようになります。
それにより、あらゆるデータはクラウド上で管理することが当たり前の世界になります。
また、あらゆるアプリケーションは自端末にインストールする必要が無くなり、これまでなら実現が難しかった3Dグラフィックなどの大きなデータを扱うようなアプリケーションであってもネットワーク越しで作業が行なえます。
そもそも、WindowsやAndroidといった端末を動かすOS自体もネットワーク越しに利用するのが当たり前になるかもしれません。
何もかもがインターネットから配信され、それをどこにいても受け取れる、そんな世界が期待できます。
ウェアラブル
「ウェアラブル」とは「wearable」であり、身に着けるとか装着するといった意味合いであり、そのような電子機器やコンピューターを「ウェアラブル・デバイス」とか、「ウェアラブル・コンピューター」と呼び、それらを総称して「ウェアラブル」と呼びます。
身に着けるものとしては、腕時計やメガネ、ベルトやネックレスなどが思い浮かびますが、それらにコンピューターを載せて、日常生活をもっと便利にしたり、企業のお仕事の効率化を図るのが「ウェアラブル」です。
アニメのキャラクターが腕に装着したコンピューターを操作したり、装着したゴーグルで敵の能力を測ったりといった姿に子供の頃は憧れましたが、現代ではApple社やGoogle社がその子供たちの夢のデバイスを実現しています。
ウェアラブルのなかでも、特に腕時計は現在でも広く利用が広がっております。
Apple社のアップルウォッチに代表される腕時計型のウェアラブルでは、インターネットとも接続して、EメールやSNSなどのメッセージアプリが使えたり、電卓機能なとの一般的なアプリケーションが使えるのはもちろんのこと、各種センサーを活用して心拍数を記録したり、心電図を測ったり、睡眠の質を計測するなどの、体の状態をデジタル的に管理するといった「常に身に着けるもの」といった特性を利用した機能を持っています。
また、ゴーグル型のウェアラブルも企業の現場作業者の作業支援などで少しづつ利用が広がりだしています。
ゴーグル型の特性としてはレンズに映像を映し出したり、装着している人の視界や視線を検出することができます。
ウェアラブルの実用化とは、電子機器の小型化、半導体の高集積化の賜物であり、一昔前までのデスクトップPCぐらいの性能のコンピューターが、腕時計サイズになり、ゴーグルにも装着できるまでのコンパクトになったとも言えます。
「ウェアラブル」でできること
腕時計型のウェアラブルについては前述した通り、広く世の中でも利用されだしております。
腕時計型であれば、装着感も一般的な腕時計と変わりがなく、ウェアラブルという機能性目的だけではなく、ファッション性といった目的でも利用されています。
腕時計型の特徴としては、常に腕に装着され、スマートフォンと同様の各種センサーを内蔵し、独自のアプリケーションを開発して動かすことができるところです。
液晶画面は小さいため、必要最小限の情報しか表示はできませんが、スマートフォンなどと連携することでそれらの補完は可能です。
現在は主にコンシューマー向けでの利用が広がっていますが、常時装着し、肌と密着する特性から、例えば医療における患者の体調管理や企業の現場作業時の安全管理、スポーツにおけるアスリートの体の状態管理など、特定の用途に特化した製品も増えていくと思われます。
ゴーグル型のウェアラブルについては企業の現場作業などでで徐々に試験的に採用されだしています。
ゴーグル型の場合、レンズ自体に情報を表示して企業の現場作業を支援する用途や、作業者の視線に映る映像をネットワーク越しに共有し、別の作業者がその映像を元に作業内容をチェックしたりアドバイスをするといった使われ方があります。
また、ゴーグル型の場合は両手が空くのも大きな特徴です。
片方の手をスマートフォンなどのデバイスで取られることがないため、医療における手術時の活用や、車の運転時の活用、プロスポーツ時の活用といった分野でも期待されています。
腕時計型やゴーグル型以外にも、例えば聴覚障害者向けのイヤフォン型ウェアラブルデバイスや衣服にコンピューターを装着する衣服型ウェアラブルデバイスなど、現在も様々な製品が検討されています。
OCR/AI-OCR
「OCR」自体は昔からある技術です。
「Optical Character Recognition」の略称であり、日本語では「光学文字認識」と呼びます。
OCRは、主に紙に印刷された文字や、手書きの文字をスキャナーやカメラなどで読み込み、文字の形などから自動的に文字を判別してテキストデータに変換する技術です。
手書きの文字については書く人によって文字には癖や個性が出て高い精度で識別することは難しいのですが、パソコンなどから印刷された文字は均一であり、OCRでも高い精度で判別できます。
また、世の中でも広く利用されているバーコードやそのバーコードを読み取るリーダーも、このOCRの技術をベースにして実装されており、広義で言えばOCRの一つと呼べます。
OCR自体の歴史は古く、WikipediaなどによるとOCRの登場は1914年まで遡るようです。
視覚障害者の支援を目的に実用化を目指すもコストの面で断念し、OCR技術が商用利用で実用されだしたのが1955年。
そこから現代まで進化をして使われている技術です。
「AI-OCR」とは
従来のOCR技術に対して、更にディープラーニングなどのAI技術を活用して読み取り精度を高めたり、読み取り位置の細かい調整を不要にするといった新しい技術です。
従来のOCRでは、文字情報を読み取る場合に、読み取った文字の形状のデータと各文字のフォントデータとを比較して類似性があれば同一の文字として判別するといったアルゴリズムで文字を読み取ります。
ただ、その仕組みの場合、コンピューターが印刷した文字であれば高い精度で判別ができますが、人間が手書きした文字は様々な癖があり判別は難しく、従来の判別アルゴリズムでは読み取り精度を高めることはできません。
そこで、ディープラーニングの技術を利用し、OCRで読み取った結果に対してAIに学習をさせることで、手書き文字であっても高い精度で判別できるようにしたのが「AI-OCR」です。
また、AI-OCRは製品によって、読み取り位置の細かい指定が不要なものもあり、従来のOCRであれば、ミリ単位での読み取り位置の設定が必要な製品も多かったのですが、これもAIが学習することで、読取位置の指定や細かい調整を行わなくても文字を読み取れる製品もあります。
AIに文字を判別させるためには、膨大な量のデータで学習させることが必要になりますが、製品によっては、AI-OCRメーカー側で予め学習が済んでおり、新しく学習をさせなくても高い精度で文字を判別させることも可能です。
このように、従来のOCR技術に対して、AI技術を利用してより便利にしたものが現在は非常に注目されています。
「OCR/AI-OCR」でできること
従来の「OCR」にしても、更にそれが進化した「AI-OCR」にしても、その技術の目的は紙に印刷された字や手書きの字をデジタルデータに変換すること。
企業の業務においてペーパーレス化が推奨され、紙ベースでの業務は減ってはいるが、それらを完全になくすことは簡単ではなく、現代でも大量の紙の書類が業務で使われ、それらを「パンチャー」と呼ばれるデータ入力担当者がデジタルデータに手作業で変換している企業も多くあります。
その様な企業では、この昔ながらのOCRや、新しいAI-OCRを上手く業務フローに取り入れることで大きく業務効率を改善できる可能性があります。
AI-OCRが従来のOCRより常に優れているかと言えば、そういったものではなく、読み取り対象のフォーマットが定型であり、パソコンなどから印刷した文字を読み取るのであれば、導入コストの大きいAI-OCRではなく、従来から広く利用されているOCR技術で十分に業務を改善できます。
また、AI-OCRを利用する場合は、手書き文字の書類のデータ化が必要になっている状況が想定されますが、そもそも手書きの書類をデータ化するビジネスフロー自体を改善する検討もするべきであり、その検討をしないままAI-OCRで対応しようとする選択はDX的ではありません。
便利な技術であっても、場合によってはその技術に頼らずして状況を改善できる選択肢も併せて検討するのもDXを進めるためには必要です。
手書き文字認識
最近ではタブレット端末の利用も増えており、タブレット端末などの画面を直接指でなぞり文字を手書きしたり、「スタイラスペン」と呼ばれる液晶画面に文字や絵を書き込む専用のペンを使用して手書きすることもできます。
その際に、人が手書きした文字から判別してテキストデータに変換する処理を「手書き文字認識」を呼びます。
前項の「OCR」では、パソコンから印刷した文字は判別しやすいが、人が手書きで書いた文字は判別が難しいと紹介しました。
ただ、手書き文字認識機能を搭載したアプリは比較的高い精度で人が手書きした文字をリアルタイムで判別できます。
なぜ、手書き文字認識機能を搭載したアプリの場合は高い精度で手書き文字を判別できるのでしょうか?
OCRで文字を判別する場合は、文字を書いた後の文字の形しか判別する要素が無いのですが、手書き文字認識機能では、文字を手書きする際の「筆順」や一筆ごとのストロークや書き出し位置など、文字を書く過程も文字判別の判定要素として利用します。
その結果、手書きの文字であってもリアルタイムに高い精度で判別が可能になります。
手書き文字認識機能は主にタブレット端末のアプリとしてインストールして、ソフトウェアキーボードの拡張機能として動作するものがあります。
「手書き文字認識」でできること
最近ではタブレット端末を小売店や飲食店などの店舗内に設置し、それまでは店舗の従業員が行っていた顧客情報の登録といった入力業務を顧客自ら行えるようにして店舗の省力化や無人化に取り組む企業も見受けられます。
その際に最もネックになるのが、パソコンやタブレットなどの電子機器の操作に不慣れな方が、どう苦労なく入力できるようにするのかといった観点です。
パソコンやタブレットでの文字入力に不慣れな人にキーボードで文字を入力してもらうのは困難であり、タブレットのソフトウェアキーボードも同様です。
また、スマートフォンなどではおなじみのフリック入力も慣れが必要です。
その様な人たちでも手書きであれば文字を入力することができます。
タブレット端末の液晶画面に対して、指やスタイラスペンを用いて手書きをしてもらい、それをテキストデータとして自動判別させることで、パソコンやタブレット端末などの電子機器の操作に不慣れな方であっても自然にデータ入力を促すことが可能です。
ただ、文字の認識精度は比較的高いとは言えすべての手書き文字を正確には判別できない為、ユーザーには必要によって、ソフトウェアキーボードの予測変換機能も活用し、表示された入力候補の文字や言葉から選択して入力をしてもらうことも必要です。
上記のように「手書き文字認識」機能は、電子機器の操作に不慣れな人たちにデータ入力を求める場合に、非常に相性の良い技術です。
RFID
「RFID」とは、「radio frequency identifier」の略称であり、「ICタグ」と呼ばれる技術の一つです。
RFIDを語る際には、一般的にICタグ側で電池などの動力源の必要のない「パッシグタグ」を前提にする場合が多い為、当記事でもパッシグタグを前提に解説します。
RFIDは、非常に小さなICタグを小売店の商品の値札やカードなどに埋め込むことができて、そのICタグの情報を専用のRFIDリーダーで読み取ることができます。
RFIDの特徴としては以下です。
- ICタグは小型でどんなものにも埋め込める
- 識別番号などのデータを格納できて読み書きできる
- 非接触での検出が可能で製品によっては数十センチから数メートルで有効
- ICタグの埋め込み先での電力は不要
- 読み取り速度が高速
- ICタグの価格も安価
- RFIDリーダーを向けた空間のICタグ全てを同時に検出
以前に、某ファストファッション大手企業が自店舗の商品の値札すべてにICタグを埋め込み、RFIDでの読み取りに対応させた際には、RFID業界でも結構話題になりました。
商品の値札にICタグを埋め込んだことで、レジでの読み取りを効率化できて、従業員が値札の情報をPOSに読み取る作業はもちろんのこと、セルフレジでもお客さんはバーコードを手動で読み取る必要がなくなりました。
また、RFIDリーダーは照射対象の空間にあるICタグを一気に読み取ってくれます。
そのため、例えば小売店などでは欠かせない業務でありながら非常に手間の掛かる「棚卸」作業なども、商品の値札のバーコードを一点ずつ読み取るのではなく、商品が並んでいる棚をRFIDリーダーでかざすだけで棚の商品の情報をすべて読み取れるようになり、大幅な業務の効率化に繋がっていると想像できます。
RFIDと似たような技術として「バーコード」があります。
バーコードもバーコードリーダーでかざすことでバーコードに埋め込まれた情報を一瞬で読み取ってくれます。
バーコード自体は印刷するだけで利用できることから、様々なものに利用されています。
バーコードだけでも十分便利ですが、バーコードの場合はバーコードに対して直接バーコードリーダーのレーザー光を当ててあげないと読み取れません。
また、バーコードの印刷面が歪んでいたり、印刷の欠けや掠れによっても読み取りができなくなります。
バーコードリーダーで読み取れる距離はRFIDほど広くはありません。
後、バーコードリーダーの一回の照射で読み取れるバーコードは一つです。
この様に、RFIDの特徴はバーコードとも似ておりますが、RFIDは更に進化をしており、バーコードのようにバーコードリーダーでレーザー光を当てる必要はなく、その読み取り対象のICタグが照射対象の空間に存在すれば読み取れます。
また、非常に小型化ができて、様々なものに埋め込むことができます。
ここが従来から利用されているバーコードと最も異なる特徴です。
「RFID」でできること
RFIDの特徴としては、非接触でデータを読み取れて、照射する空間に存在するICタグを広く検出できるところ。
そのICタグは非常に小型化されており、電力も不要。
最近ではICタグ自体の単価もだいぶ安くなってきており、使い捨てでの利用も可能になってきています。
それらの特徴から、現在も利用されておりますし、今後もより導入が進むと思われるのが「トレーサビリティ分野」です。
製品の製造から物流、販売までの一連のプロセスごとにRFIDで読み取り、流れを追うことができます。
もちろん主要な企業はこれまでにバーコードを利用して同様のトレーサビリティを実現していますが、RFIDを利用することで、前述した棚卸の例のように、より効率よく管理することができるようになります。
また、RFIDは小型で様々なものに埋め込むことができるため、現在ではクレジットカードやキャッシュカードなどでは当然にように埋め込まれておりますが、今後は更に様々なものに埋め込まれていくことが予想されており、場合によっては人体に埋め込んで人間自体をRFIDで管理する時代が来るかも知れません。
スマートフォンアプリ
現在の世の中で利用されている携帯電話の多くは「スマートフォン」であり、スマートフォンでは「スマートフォン用の専用アプリケーション」をインストールして、インターネットに繋いでウェブサイトを閲覧したり、メールをしたり、動画を閲覧したり、ゲームをしたり、地図とGPSで経路案内をしたりと、ただの電話機としての機能を超えた、様々な機能を提供する無くてはならないデバイスとして進化しています。
普段当たり前のように利用しているスマートフォンですが、業務利用やマーケティングなどのビジネス視点で見てみると、非常に魅力のあるデバイスです。
改めてスマートフォンの特徴を列挙してみましょう。
- キーボードやマウスなどの入力デバイスが不要
- バッテリーを内蔵し場所の制約なく利用できる
- 個人情報が集約されている
- GPSで位置情報が取れる
- Bluetoothで様々なデバイスと接続できる
- RFIDタグを内蔵しRFIDリーダーで検出、読み取りができる
- インターネットと常時接続している
- カメラで静止画と動画の撮影ができる
- マイクとスピーカーで録音と音楽などの再生ができる
- 加速度センサーで動きを検出できる
- ジャイロセンサーで傾きを検出できる
- 磁気センサーで磁場を計測して方向を検出できる
- 高精度な生体認証が搭載されている
どうでしょうか。
様々な機能やセンサーを搭載し、まさに現代の科学技術の結晶とも言えます。
そんなスマートフォンですが、スマートフォンアプリであれば、これらの機能や各センサーの殆どにアクセスして、アプリの機能に組み込むことができます。
もちろんスマートフォンの各機能やセンサーをアプリに組み込んでも、スマートフォンを動かしている大元のAndroidやiOSといったOS側では、不必要なアクセス権を制限する仕組みがあり、そのアプリをインストールしたユーザーから各機能やセンサーへのアクセス権の許可をしてもらう必要があります。
ユーザーに無断でアドレス帳にアクセスしたり、GPSの位置情報を取得したりすることはできません。
ただ、アクセス権さえもらえれば、スマートフォン用のアプリを開発してユーザーに利用してもらうことで、様々なデータが得られ、各機能やセンサーと連携することで、これまでにない体験を提供することができます。
「スマートフォンアプリ」でできること
前項で紹介した様々な機能やセンサーを活用することで、本当に色んなアプリケーションを作成することができます。
今でもAndroidやiOSのアプリストアを覗くと、様々なジャンルのアプリが公開されており、その数は数え切れません。
ゲームはもちろんのこと、加速度センサーやジャイロセンサーを利用したフィットネス用アプリ、磁気センサーを利用した金属探知機アプリ、RFIDやBluetoothを活用した端末捜索用アプリ、その他の機能や各種センサーを活用したアプリが無限に提供されています。
また、企業のマーケティングや販促目的として、小売店のポイントサービス用アプリや、店舗での買い物時の決済をセルフ化するアプリ、顧客のデジタル会員証アプリなどもあります。
これらのアプリでは、アプリ内でそのユーザーへ直接ダイレクトメールのようにメッセージを送ったり、アプリをインストールしたユーザーが店舗の近く来たことを検出して、スマートフォンのプッシュ通知を出して来店を促すといったことができます。
なので、スマートフォンアプリでできることは?と言問われれば、「アイデア次第でなんでもできます」といった返答になります。
今では当たり前のように利用されているスマートフォンアプリですが、DXを検討するにあたっては、まずはスマートフォンアプリでできることはないかといった観点で考えてみるのも良いかもしれません。
最後に
今回の記事では「DX」を検討するうえで、知っておいた方が良いIT技術を紹介しました。
冒頭でもお伝えしましたが、これらの技術を使用してデジタル化をすれば「DX」になるわけではなく、これらの新しい技術を使うことで、これまでは不可能だった問題が解消されて、事業や業務などに変革をもたらす取り組みが「DX」です。
そのため、今のIT業界ではどのような技術が注目されており、それらはどのような仕組みで動いており何ができるのかを知ることは非常に重要だと思います。
その知識無くしてDXの実現は不可能です。
今回の記事がDXを検討されている企業の経営者様やシステム企画担当者様、情報システム部門担当者様のお役に立てれば幸いです。
今回も長々と読んでいただきましてありがとうございました。
それでは皆さまごきげんよう。