skainet-io-onnx/sk.ainet.io.onnx/StreamingOnnxReader

StreamingOnnxReader

class StreamingOnnxReader : AutoCloseable(source)

Streaming ONNX reader that parses metadata without loading tensor data.

Memory usage is proportional to metadata size (~1-10 MB), not file size (100+ GB). Individual tensors can be loaded on-demand via loadTensorData.

This enables parsing of very large ONNX model files without requiring the entire file to fit in memory.

Usage:

StreamingOnnxReader.open(source).use { reader ->
    // Access metadata immediately - only metadata loaded
    println("Tensors: ${reader.tensors.size}")
    println("IR Version: ${reader.irVersion}")

    // Load specific tensor when needed
    val weights = reader.loadTensorData("conv1.weight")
}

Types

object Companion

Properties

var docString: String

Doc string

var domain: String

Model domain

var graphName: String

Graph name

var irVersion: Long

ONNX IR version

var modelVersion: Long

Model version

val opsetImports: MutableMap<String, Long>

Opset imports (domain -> version)

var producerName: String

Producer name

producerVersion

var producerVersion: String

Producer version

val tensors: List<StreamingOnnxTensorInfo>

Parsed tensor metadata (without actual tensor data)

Functions

open override fun close()

fun loadTensorData(name: String): ByteArray

Load tensor data by name.

fun loadTensorData(tensor: StreamingOnnxTensorInfo): ByteArray

Load tensor data for a specific tensor.

fun loadTensorData(tensor: StreamingOnnxTensorInfo, buffer: ByteArray, offset: Int = 0): Int

Load tensor data into an existing buffer.

loadTensorDataAsync

suspend fun StreamingOnnxReader.loadTensorDataAsync(name: String): ByteArray

Load tensor data asynchronously by name.

suspend fun StreamingOnnxReader.loadTensorDataAsync(tensor: StreamingOnnxTensorInfo): ByteArray

Load tensor data asynchronously for a specific tensor.

suspend fun StreamingOnnxReader.loadTensorDataAsync(name: String): ByteArray

Load tensor data asynchronously by name.

suspend fun StreamingOnnxReader.loadTensorDataAsync(tensor: StreamingOnnxTensorInfo): ByteArray

Load tensor data asynchronously for a specific tensor.