Don’t rush to machine learning

A simpler approach—good data, SQL queries, if/then statements—often gets the job done.

It turns out the best way to do machine learning (ML) is sometimes to not do any machine learning at all. In fact, according to Amazon Applied Scientist Eugene Yan, “The first rule of machine learning [is to] start without machine learning.”

What?

Yes, it’s cool to trot out ML models painstakingly crafted over months of arduous effort. It’s also not necessarily the most effective approach. Not when there are simpler, more accessible methods.

It may be an oversimplification to say, as data scientist Noah Lorang did years ago, that “data scientists mostly just do arithmetic.” But he’s not far off, and certainly he and Yan are correct that however much we may want to complicate the process of putting data to work, much of the time it’s better to start small.

AI活用で不審者検知を、国交省 小田急事件受け

国土交通省は24日、小田急線電車内で起きた乗客刺傷事件を受けてJRや大手私鉄各社などと意見交換し、AIを含む最新技術を活用した不審者検知機能の高度化などの対策をまとめたと発表した。

警備員の巡回など駅や車内の警戒を強化し、ポスターやアナウンスで周知。防犯カメラを増設し、画像解析などで不審者や不審物を検知する技術を関係者間で共有する方策なども検討する。ピクトグラムを使った非常通報装置の使用方法の分かりやすい表示にも努める。

防犯カメラの検知機能を巡っては、JR東日本が同社への重大犯罪で服役した出所者を顔認証機能の検知対象とする方針を撤回したばかり。

少ないデータでAIが作れる技術「スパースモデリング」とは?

「スパースモデリング」と呼ばれるデータ分析手法をご存知だろうか。わずかなデータからでもAIモデルを構築可能な技術であり、2019年にイベント・ホライズン・テレスコープが公開した、ブラックホールシャドウの撮影に利用された手法としても知られる。

スパースモデリングは膨大な量のデータから学習するディープラーニングとは反対に、わずかなデータ量からでもAIを構築可能であり、AIが結論を導く過程が人間にも理解しやすく、AIのブラックボックス化問題の回避も可能だという。

独自のスパースモデリング技術をAIに応用してデジタルソリューションを開発する、AIスタートアップ HACARUSの代表取締役 CEO 藤原健真氏に、同技術の概要と今後の発展性について話を聞いた。

OpenAI unveils model that can summarize books of any length

OpenAI has developed an AI model that can summarize books of arbitrary length. A fine-tuned version of the research lab’s GPT-3, the model works by first summarizing small sections of a book and then summarizing those summaries into higher-level summaries, following a paradigm OpenAI calls “recursive task decomposition.”

Summarizing book-length documents could be valuable in the enterprise, particularly for documentation-heavy industries like software development. A survey by SearchYourCloud found that workers take up to eight searches to find the right document, and McKinsey reports that employees spend 1.8 hours every day — 9.3 hours per week, on average — searching and gathering job-related information.

ソニーの予測分析ツール「Prediction One」がAPI機能を追加 自社アプリやツールへの予測AI組み込みが簡単に

ソニーネットワークコミュニケーションズ株式会社は、予測分析ツール「Prediction One(プレディクション ワン)」の新機能を9月15日から提供開始したと発表した。

「Prediction One」は、機械学習やプログラミングなどの専門知識がなくても数クリックの簡単な操作で予測分析が実現できるツールだ。自動的に評価データを構成したあと、複数の先端モデルを試して、最も精度の良いモデルを選び、そのモデルで予測精度と予測寄与度を算出してレポートを生成していく。予測結果の理由が説明できる点なども好評を博し、2019年に提供を開始して以来、申込企業数は累計で21,000社を超えている。

今回新たに追加されたのは予測API機能「Prediction One API」だ。

同APIを介せば、「Prediction One」で作成した予測モデルを、数行のコードで外部アプリケーションから簡単に呼び出せる。作成した予測モデルを自社アプリケーションや自社業務システムに組み込むことで、AIの活用の幅を飛躍的に広げられるという。