Evolve logo オンデマンド配信 Evolve 2023 Tokyo|AI、データと分析の先進事例を紹介
  • Cloudera Cloudera
  • Fast Forward Labs 調査レポートが、サブスクリプション不要でご利用頂けるようになりました

    今後、全ての新しいレポートは一般に公開され、無料でダウンロードできるようになります。さらに、過去の古いレポートのアップデートバージョンにもアクセスできるようにする予定です。利用可能な無料の調査レポートを頻繁にチェックしてみてください。

    無料の調査レポート

    誰でも無料でアクセスできる、最新の調査レポートとプロトタイプを確認する。 

    テキストスタイルの転送

    テキストスタイル転送 (TST) の NLP タスクの目的は、コンテンツを保持しながらテキストのスタイル属性を自動的に制御することです。これは NLP をよりユーザー中心にするための重要な考慮事項です。このレポートでは、適用されたユースケースを通じて、フリーテキストの主観性バイアスを排除した、テキストスタイルの転送について説明します。その過程で、HuggingFace Transformers を活用したシーケンス間モデリングアプローチについても説明し、モデルのパフォーマンスを定量化するための一連のリファレンスフリーのカスタム評価メトリクスを提示します。最後に、弊社のプロトタイプ「Exploring Intelligent Writing Assistance」の中心にある倫理に関する解説をご紹介します。

    レポートを読む
    コードを見る

    テキストスタイルの転送

    ラベル付きデータなしでコンセプトドリフトを推定する

    概念ドリフトとは、対象となるドメインの統計的特性が時間の経過とともに変化し、モデルの性能が低下することです。ドリフトの検出は、対象となるパフォーマンス指標を監視し、その指標がある指定された閾値を下回ったときに再トレーニングパイプラインをトリガーすることで実現されます。しかし、このアプローチは、予測時に十分な量のラベル付きデータが得られることを前提としていますが、多くの生産システムでは非現実的な制約となっています。本レポートでは、ラベル付きデータに容易にアクセスできない場合に、コンセプトドリフトに対処するための様々なアプローチを検討しています。

    レポートを読む
    コードを見る

     ラベル付きデータなしでコンセプトドリフトを推定する

    多目的ハイパーパラメータの最適化の探求

    Cloudera は、予測精度、再現率、適合率といった“主要”な指標を使って機械学習モデルを開発しています。しかし、これらの指標だけを気にかけていればよいということはほとんどありません。本番環境モデルは、レイテンシやメモリフットプリント、あるいは公平性の制約などの物理的な要件も満たす必要があります。ハイパーパラメータの最適化は、最適化すべき指標が複数あると非常に困難になります。Cloudera の最新の調査では、この“多目的”ハイパーパラメータの最適化シナリオについて詳しく考察しています。

    レポートを読む
    コードを見る

    多目的ハイパーパラメータの最適化の探求

    オフライン署名の自動検証のためのディープラーニング

    手書き署名の検証は、本物の署名と偽造された署名を自動的に識別することを目的としており、法律、金融、行政などの分野で身分証明書の様式として手書き署名が普及していることから、特に重要な課題となっています。この研究サイクルでは、従来の技術を改善するために、ディープメトリックラーニングのアプローチ、特にシャムネットワークと新しい特徴抽出手法を組み合わせて使用する方法について調査しました。

    レポートを読む
    コードを見る

    少数ショットテキスト分類

    セッションベースのレコメンダシステム

    レコメンデーションシステムは、オンライン小売業、音楽や動画のストリーミング、さらにはコンテンツ公開などの分野において、現代生活の基盤となっています。これらのシステムは、インターネット上の膨大なコンテンツの中から、自分にとって重要なものや興味があるものを見つけるのに役立ちます。ここ数年間の主なトレンドは、実行中のセッションでのユーザーのやり取りのみに基づいておすすめを提供するセッションベースのレコメンデーションアルゴリズムです。このアルゴリズムを使用する場合、ユーザープロファイルや過去の好みなどの情報は必要ありません。

    レポートを読む
    コードを見る

    少数ショットテキスト分類

    少数ショットテキスト分類

    テキスト分類は、感情分析、トピック割り当て、文書識別、記事推薦などに利用できます。現在、この基礎的な処理には何十という手法が存在しますが、その多くは、ラベル付けした大量のデータがないと使い物になりません。一般に、どの機械学習アプリケーションでも、目的のユースケースに関する注釈の収集が最もコストのかかる作業の1つです。このレポートでは、トレーニングサンプルが少ない、またはまったくない場合に潜在的なテキスト埋め込みをどのように使えるかを調査し、この方法を実装するためのベストプラクティスを洞察します。

    レポートを読む
    コードを見る

    少数ショットテキスト分類

    構造的時系列

    時系列データはいたるところに存在します。このレポートでは、一般化加法モデルについて考察します。このモデルでは、時系列を構造成分に分解することにより、単純で柔軟かつ解釈可能な方法で時系列をモデリングできます。時系列に曲線的適合法を使用する場合の利点と欠点を検討し、需要予測の問題で Facebook の Prophet ライブラリを介して実際にこの手法を使用します。

    レポートを読む
    コードを見る

    メタ学習

    人間の学習とは対照的に、ディープラーニングアルゴリズムは膨大な量のデータと計算を必要とし、まだ十分に一般化していません。人間は、新しい問題に直面したとき、経験から得た知識を利用して、すぐに適応できます。このレポートでは、メタ学習においてテスト時に新しいタスクを迅速かつ効率的に解決するため、データから取得した事前知識をどのように活用できるかを説明します。

    レポートを読む
    コードを見る

    自動質問応答システム

    質問応答機能は、自然言語を使ってデータから情報を引き出すユーザーフレンドリーな機能です。最近の自然言語処理の進歩によって、非構造化テキストデータを使う質問応答機能が急速な発展を遂げています。このブログシリーズでは、包括的な質問応答システムを構築する上での概要を技術的、実践的に説明しています。

    インタラクティブブログシリーズを読む

    機械学習のための因果推論

    因果推論と機械学習の関係は、研究が急速に進んでおり、より堅固で信頼性の高い公正な機械学習システムの構築を実現するものとして注目を浴びています。本レポートでは、因果関係グラフや不偏予測といった因果推論の概要に加え、さまざまなユースケースに従来の機械学習技術と因果関係ツールを合わせて応用する方法について説明します。

    レポートを読む
    プロトタイプを見る

    説明可能性:2020年版

    説明可能性、つまりシステムが決定を下す理由と方法を説明する能力は、モデルの改善や規制対応、優れた製品の構築などに役立ちます。ディープラーニングのようなブラックボックスな技術は、説明可能性を犠牲にして画期的な機能を提供してきました。最近アップデートされた本レポートでは、SHAP のような技術を含め、機能や正確さを損なうことなく、説明可能性を備えたモデルを構築する方法について説明しています。

    レポートを読む

    異常値検知のためのディープラーニング

    不正の検出から画像データの異常検知に至るまで、異常なデータを自動的に識別するためのアプリケーションは無数に存在します。特に大規模で複雑なデータを扱う場合には、このプロセスが非常に困難なものになる可能性があります。本レポートでは、ディープラーニング手法 (シーケンスモデル、VAE、GAN) による異常値の検知、使用すべきタイミング、パフォーマンスベンチマーク、さらに製品の可能性を探ります。

    レポートを読む
    プロトタイプを見る

    Fast Forward Labs による画像分析のためのディープラーニング- 2019年版レポートのプレビュー

    ニューラル言語処理のための転移学習

    ディープラーニングを使用した自然言語処理 (NLP) テクノロジーによって、言葉の翻訳や質問への回答、人間に近い文書の作成などが可能になりますが、このようなディープラーニング技術には、大規模でコストの高いラベル付きデータセット、高価なインフラストラクチャー、希少な専門知識が必要です。転移学習は、モデルの言語理解を再利用して適応させることで、このような制約を取り除き、どのような NLP アプリケーションにも適合します。本レポートでは、転移学習を使って、最小限のリソースで高性能な NLP システムを構築する方法をご紹介します。

    レポートを読む

    Fast Forward Labs による NLP のための転移学習レポート

    ラベルに制限のあるデータを使った学習

     限られた数のラベル付きデータで学習できるので、教師あり機械学習の厳格なラベル付きデータ要件を緩和できます。このレポートでは特に、機械と人間が協力しながら効率的にラベル付けを行う手法である能動学習に注目します。能動学習によって、モデルのトレーニングに必要なラベル付きサンプルの数が減り、はるかに多くのデータでトレーニングされたモデルと同等のパフォーマンスを達成すると同時に、時間と費用を節約できます。能動学習を導入すれば、企業は大量に蓄積されたラベルなしデータを活用して、新しい製品の可能性を開拓できます。

    レポートを読む
    プロトタイプを見る

    限られた数のラベル付きデータを活用する Fast Forward Labs 学習

    フェデレーションラーニング

    フェデレーションラーニングにより、トレーニングデータに直接アクセスしない機械学習システムを構築できます。データは元の場所に保持されるため、プライバシーを確保でき、通信コストを削減できます。フェデレーションラーニングは、スマートフォンやエッジハードウェア、ヘルスケアの他、プライバシーが重視されるユースケース、予知保全などの産業アプリケーションに最適です。

    レポートを読む
    プロトタイプを見る

    Fast Forward Labs による画像分析のためのディープラーニング- 2019年版レポートのプレビュー

    セマンティックレコメンデーション

    インターネットにより、私たちが読むもの、見るもの、そして買うものの選択肢が爆発的に増えました。このため、特定の人の興味を引くアイテムを見つけるレコメンデーションアルゴリズムがこれまで以上に重要になっています。本レポートでは、アイテムとユーザーのセマンティックコンテンツを活用し、複数の業界にわたってより豊富なレコメンデーションを提供するレコメンデーションシステムについて説明します。

    レポートを読む

    セマンティックレコメンデーション

    要約

    このレポートでは、文書の要約を自動的に出力できる機能である抽出型要約の手法について探ります。何千もの製品レビューから要点を導き出したり、長文のニュース記事から最も重要な内容を抽出したり、顧客の経歴を自動的に集めてその人物像を割り出したり、この手法を活用できる分野は実にさまざまです。

    レポートを読む

    Fast Forward Labs による画像分析のためのディープラーニング- 2019年版レポートのプレビュー

    画像分析のためのディープラーニング - 2019年版

    画像内の特徴や概念における意味のある表現に対する学習能力に優れた、畳み込みニューラルネットワーク (CNN あるいは ConvNets) は、医療画像や製造業などさまざまな分野の課題解決に対して有効な手段となっています。本レポートでは、画像解析のための適切なディープラーニングモデルの選び方や、そのデバッキングテクニックなどについて解説しています。

    レポートを読む
    プロトタイプを見る

    Fast Forward Labs による画像分析のためのディープラーニング- 2019年版レポートのプレビュー

    ディープラーニング: 画像分析

    本レポートでは、ディープラーニングの歴史や最新の状況、適用方法、さらに将来の機能に関する見通しなどを説明しています。

    レポートを読む

    確率論的手法によるリアルタイムストリーム

    カムと歯車で構築されたアナログコンピューターの時代から今日に至るまで、処理すべきデータフローと重要な演算を中心にシステムが構築されてきました。設計の原理に変わりはありませんが、システムを構築するうえでの制約は常に進化しています。ここ5年間で、「ビッグデータ」、つまりコモディティインフラストラクチャーを使用して非常に大きなデータセットをまとめて分析する機能が台頭してきました。今は、リアルタイムのデータストリームを処理するために利用できるツール、方法、テクノロジーにおける進化のさなかにあります。

    レポートを読む

    サブスクリプション限定レポート

    古いレポートのアップデートバージョンは、今後無料で利用が可能となる予定です。是非、頻繁にご確認ください。

    マルチタスク学習のレポートとプロトタイプの画像

    マルチタスク学習

    本レポートでは、関連する複数のタスクを同時に学習させるアルゴリズムを可能にした、機械学習の新たなアプローチであるマルチタスク学習を特集しています。

    確率論的プログラミング

    ここでは、より効果的な意思決定のための予測機能を提供するツールを容易に構築するための、確率論的プログラミングとベイジアン (Bayesian) インターフェースの使い方について説明しています。

    自然言語生成

    このレポートでは、高度に構造化されたデータを、機械システムを使っていかに人間が話す口調に変換できるかについて探求しています。

    Fast Forward Labs のブログを読む

     

    最新情報の入手

    毎月提供されるニュースレターの配信登録を行い、人工知能応用技術の進展に関する最新情報、Cloudera のニュースやイベント情報を入手してください。

     

    リサーチのサブスクリプションに関するお問い合わせ

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.