ONNX Runtime（おんねっくすらいむたいむ）

最終更新：2026/4/27

ONNX Runtimeは、オープンソースの機械学習推論エンジンであり、様々なプラットフォーム上でONNX形式のモデルを実行する。

別名・同義語 ORT

ポイント

ONNX Runtimeは、CPU、GPU、その他のハードウェアアクセラレータをサポートし、高いパフォーマンスと効率的な推論を実現する。

ONNX Runtimeとは

ONNX Runtimeは、Microsoftが開発したクロスプラットフォームの機械学習推論エンジンです。ONNX（Open Neural Network Exchange）は、機械学習モデルを表現するためのオープンな形式であり、ONNX Runtimeは、このONNX形式で保存されたモデルを様々なハードウェア環境で効率的に実行することを目的としています。

ONNXの役割

ONNXは、異なる機械学習フレームワーク（PyTorch, TensorFlow, scikit-learnなど）で学習されたモデルを共通の形式に変換するための標準規格です。これにより、あるフレームワークで学習されたモデルを、別のフレームワークや環境で再学習することなく利用できるようになります。ONNX Runtimeは、このONNX形式のモデルを解釈し、実行するためのエンジンとして機能します。

特徴

クロスプラットフォーム: Windows, Linux, macOS, Android, iOSなど、様々なプラットフォームをサポートしています。
ハードウェアアクセラレーション: CPU、GPU（NVIDIA CUDA, DirectML）、その他のハードウェアアクセラレータを活用し、推論処理を高速化します。
高性能: モデルの最適化や並列処理により、高い推論パフォーマンスを実現します。
オープンソース: オープンソースライセンスで提供されており、自由に利用、改変、配布できます。
幅広いモデルサポート: 画像認識、自然言語処理、音声認識など、様々な種類の機械学習モデルをサポートします。

用途

ONNX Runtimeは、以下のような用途で利用されています。

エッジデバイスでの推論: スマートフォン、IoTデバイスなどのリソースが限られた環境で、機械学習モデルを実行します。
クラウドサービスでの推論: 大規模なデータセットに対して、高速かつ効率的に推論処理を行います。
リアルタイムアプリケーション: 自動運転、ロボット制御など、リアルタイム性が求められるアプリケーションで利用されます。

ONNX Runtimeとは

ONNXの役割

特徴

用途

関連技術