NVIDIABackendAdapter

Defined in: backend/src/providers/nvidia.ts:67

Backend adapter for NVIDIA NIM API.

NVIDIA NIM (NVIDIA Inference Microservices) provides optimized inference with OpenAI-compatible API. Supports various models including Llama, Mistral, and other popular open-source models.

Examples

import { NVIDIABackendAdapter } from 'ai.matey';

const adapter = new NVIDIABackendAdapter({
  apiKey: process.env.NVIDIA_API_KEY,
});

const adapter = new NVIDIABackendAdapter({
  apiKey: process.env.NVIDIA_API_KEY,
});

const response = await adapter.execute({
  messages: [{ role: 'user', content: 'Hello!' }],
  parameters: {
    model: 'meta/llama-3.1-405b-instruct',
  },
});

const adapter = new NVIDIABackendAdapter({
  apiKey: process.env.NVIDIA_API_KEY,
  baseURL: 'https://your-nim-endpoint.nvidia.com/v1',
});

const stream = adapter.executeStream({
  messages: [{ role: 'user', content: 'Tell me a story' }],
  parameters: {
    model: 'nvidia/llama-3.1-nemotron-70b-instruct',
  },
});

for await (const chunk of stream) {
  if (chunk.type === 'content') {
    console.log(chunk.delta);
  }
}

Extends

OpenAIBackendAdapter

Implements

BackendAdapter<OpenAIRequest, OpenAIResponse>

Constructors

Constructor

new NVIDIABackendAdapter(config): NVIDIABackendAdapter

Defined in: backend/src/providers/nvidia.ts:71

Parameters

config

BackendAdapterConfig

Returns

NVIDIABackendAdapter

Overrides

OpenAIBackendAdapter.constructor

Properties

baseURL

protected readonly baseURL: string

Defined in: backend/src/providers/openai.ts:162

Inherited from

OpenAIBackendAdapter.baseURL

config

protected readonly config: BackendAdapterConfig

Defined in: backend/src/providers/openai.ts:161

Inherited from

OpenAIBackendAdapter.config

metadata

readonly metadata: AdapterMetadata

Defined in: backend/src/providers/openai.ts:160

Adapter metadata for identification and capabilities.

Implementation of

BackendAdapter.metadata

Inherited from

OpenAIBackendAdapter.metadata

Methods

estimateCost()

estimateCost(request): Promise<number | null>

Defined in: backend/src/providers/nvidia.ts:127

Estimate cost for NVIDIA NIM.

Parameters

request

IRChatRequest

Returns

Promise<number | null>

Implementation of

BackendAdapter.estimateCost

Overrides

OpenAIBackendAdapter.estimateCost

execute()

execute(request, signal?): Promise<IRChatResponse>

Defined in: backend/src/providers/openai.ts:221

Execute non-streaming chat completion request.

Parameters

request

IRChatRequest

signal?

AbortSignal

Returns

Promise<IRChatResponse>

Implementation of

BackendAdapter.execute

Inherited from

OpenAIBackendAdapter.execute

executeStream()

executeStream(request, signal?): IRChatStream

Defined in: backend/src/providers/openai.ts:260

Execute streaming chat completion request.

Parameters

request

IRChatRequest

signal?

AbortSignal

Returns

Implementation of

BackendAdapter.executeStream

Inherited from

OpenAIBackendAdapter.executeStream

fromIR()

fromIR(request): OpenAIRequest

Defined in: backend/src/providers/openai.ts:605

Convert IR request to OpenAI format.

Public method for testing and debugging - see what will be sent to OpenAI.

Parameters

request

IRChatRequest

Returns

OpenAIRequest

Implementation of

BackendAdapter.fromIR

Inherited from

OpenAIBackendAdapter.fromIR

healthCheck()

healthCheck(): Promise<boolean>

Defined in: backend/src/providers/nvidia.ts:107

Health check for NVIDIA NIM API.

Returns

Promise<boolean>

Implementation of

BackendAdapter.healthCheck

Overrides

OpenAIBackendAdapter.healthCheck

invalidateModelCache()

invalidateModelCache(): OpenAIBackendAdapter

Defined in: backend/src/providers/openai.ts:591

Invalidate the cached model list.

Forces the next listModels() call to fetch fresh data from the API (unless static models are configured).

Returns

OpenAIBackendAdapter

This adapter for method chaining

Inherited from

OpenAIBackendAdapter.invalidateModelCache

listModels()

listModels(options?): Promise<ListModelsResult>

Defined in: backend/src/providers/openai.ts:501

List available models from OpenAI.

This method supports three sources:

Static config (config.models) - highest priority
Cache (if enabled and not expired)
Remote API (/v1/models endpoint)

Parameters

options?

ListModelsOptions

Returns

Promise<ListModelsResult>

Implementation of

BackendAdapter.listModels

Inherited from

OpenAIBackendAdapter.listModels

toIR()

toIR(response, originalRequest, latencyMs): IRChatResponse

Defined in: backend/src/providers/openai.ts:652

Convert OpenAI response to IR format.

Public method for testing and debugging - parse OpenAI responses manually.

Parameters

response

OpenAIResponse

originalRequest

IRChatRequest

latencyMs

number

Returns

IRChatResponse

Implementation of

BackendAdapter.toIR

Inherited from

OpenAIBackendAdapter.toIR