NodeLlamaCppBackend

Defined in: native-node-llamacpp/src/index.ts:79

Backend adapter for node-llama-cpp.

Uses native bindings to llama.cpp for efficient local inference.

Implements

BackendAdapter

Constructors

Constructor

new NodeLlamaCppBackend(config): NodeLlamaCppBackend

Defined in: native-node-llamacpp/src/index.ts:99

Parameters

config

NodeLlamaCppConfig

Returns

NodeLlamaCppBackend

Properties

metadata

readonly metadata: AdapterMetadata

Defined in: native-node-llamacpp/src/index.ts:80

Adapter metadata for identification and capabilities.

Implementation of

BackendAdapter.metadata

Methods

dispose()

dispose(): Promise<void>

Defined in: native-node-llamacpp/src/index.ts:350

Clean up resources.

Returns

Promise<void>

execute()

execute(request): Promise<IRChatResponse>

Defined in: native-node-llamacpp/src/index.ts:176

Execute a non-streaming chat request.

Parameters

executeStream()

executeStream(request): IRChatStream

Defined in: native-node-llamacpp/src/index.ts:248

Execute a streaming chat request.

Parameters

request

IRChatRequest

Returns

IRChatStream

Implementation of

BackendAdapter.executeStream

fromIR()

fromIR(request): IRChatRequest

Defined in: native-node-llamacpp/src/index.ts:158

Convert IR request to provider format (passthrough - uses IR internally).

Parameters

request

IRChatRequest

Returns

IRChatRequest

Implementation of

BackendAdapter.fromIR

initialize()

initialize(): Promise<void>

Defined in: native-node-llamacpp/src/index.ts:115

Initialize the model and context. Must be called before using execute() or executeStream().

Returns

Promise<void>

toIR()

toIR(response, _originalRequest, _latencyMs): IRChatResponse

Defined in: native-node-llamacpp/src/index.ts:165

Convert provider response to IR format (passthrough - uses IR internally).

Parameters

response

IRChatResponse

_originalRequest

IRChatRequest

_latencyMs

number

Returns

IRChatResponse

Implementation of

BackendAdapter.toIR