Squashed 'vendor/ruvector/' content from commit b64c2172

git-subtree-dir: vendor/ruvector git-subtree-split: b64c21726f2bb37286d9ee36a7869fef60cc6900
2026-02-28 14:39:40 -05:00
commit d803bfe2b1
7854 changed files with 3522914 additions and 0 deletions
--- a/npm/packages/ruvllm/src/export.ts
+++ b/npm/packages/ruvllm/src/export.ts
@@ -0,0 +1,509 @@
+/**
+ * Export/Serialization for SONA Models
+ *
+ * Support for SafeTensors, JSON, and other export formats.
+ *
+ * @example
+ * ```typescript
+ * import { ModelExporter, SafeTensorsWriter } from '@ruvector/ruvllm';
+ *
+ * // Export model to SafeTensors format
+ * const exporter = new ModelExporter();
+ * const buffer = exporter.toSafeTensors({
+ *   weights: loraAdapter.getWeights(),
+ *   config: loraAdapter.getConfig(),
+ * });
+ *
+ * // Save to file
+ * fs.writeFileSync('model.safetensors', buffer);
+ * ```
+ */
+
+import { LoRAConfig, LearnedPattern, EwcStats, Embedding, ModelMetadata } from './types';
+import { LoraWeights } from './lora';
+
+/**
+ * Exportable model data
+ */
+export interface ExportableModel {
+  /** Model metadata */
+  metadata: ModelMetadata;
+  /** LoRA weights (if applicable) */
+  loraWeights?: LoraWeights;
+  /** LoRA config */
+  loraConfig?: LoRAConfig;
+  /** Learned patterns */
+  patterns?: LearnedPattern[];
+  /** EWC statistics */
+  ewcStats?: EwcStats;
+  /** Raw tensors */
+  tensors?: Map<string, Float32Array>;
+}
+
+/**
+ * SafeTensors header entry
+ */
+interface SafeTensorsHeader {
+  dtype: string;
+  shape: number[];
+  data_offsets: [number, number];
+}
+
+/**
+ * SafeTensors Writer
+ *
+ * Writes tensors in SafeTensors format for compatibility with
+ * HuggingFace ecosystem.
+ */
+export class SafeTensorsWriter {
+  private tensors: Map<string, { data: Float32Array; shape: number[] }> = new Map();
+  private metadata: Record<string, string> = {};
+
+  /**
+   * Add a tensor
+   */
+  addTensor(name: string, data: Float32Array, shape: number[]): this {
+    this.tensors.set(name, { data, shape });
+    return this;
+  }
+
+  /**
+   * Add 2D tensor from number array
+   */
+  add2D(name: string, data: number[][]): this {
+    const rows = data.length;
+    const cols = data[0]?.length || 0;
+    const flat = new Float32Array(rows * cols);
+
+    for (let i = 0; i < rows; i++) {
+      for (let j = 0; j < cols; j++) {
+        flat[i * cols + j] = data[i][j];
+      }
+    }
+
+    return this.addTensor(name, flat, [rows, cols]);
+  }
+
+  /**
+   * Add 1D tensor from number array
+   */
+  add1D(name: string, data: number[]): this {
+    return this.addTensor(name, new Float32Array(data), [data.length]);
+  }
+
+  /**
+   * Add metadata
+   */
+  addMetadata(key: string, value: string): this {
+    this.metadata[key] = value;
+    return this;
+  }
+
+  /**
+   * Build SafeTensors buffer
+   */
+  build(): Uint8Array {
+    // Build header
+    const header: Record<string, SafeTensorsHeader | Record<string, string>> = {};
+    let offset = 0;
+
+    const tensorData: Uint8Array[] = [];
+
+    for (const [name, { data, shape }] of this.tensors) {
+      const bytes = new Uint8Array(data.buffer);
+      const dataLength = bytes.length;
+
+      header[name] = {
+        dtype: 'F32',
+        shape,
+        data_offsets: [offset, offset + dataLength],
+      };
+
+      tensorData.push(bytes);
+      offset += dataLength;
+    }
+
+    // Add metadata
+    if (Object.keys(this.metadata).length > 0) {
+      header['__metadata__'] = this.metadata;
+    }
+
+    // Encode header
+    const headerJson = JSON.stringify(header);
+    const headerBytes = new TextEncoder().encode(headerJson);
+
+    // Pad header to 8-byte alignment
+    const headerPadding = (8 - (headerBytes.length % 8)) % 8;
+    const paddedHeaderLength = headerBytes.length + headerPadding;
+
+    // Build final buffer
+    const totalLength = 8 + paddedHeaderLength + offset;
+    const buffer = new Uint8Array(totalLength);
+    const view = new DataView(buffer.buffer);
+
+    // Write header length (8 bytes, little-endian)
+    view.setBigUint64(0, BigInt(paddedHeaderLength), true);
+
+    // Write header
+    buffer.set(headerBytes, 8);
+
+    // Write tensor data
+    let dataOffset = 8 + paddedHeaderLength;
+    for (const data of tensorData) {
+      buffer.set(data, dataOffset);
+      dataOffset += data.length;
+    }
+
+    return buffer;
+  }
+
+  /**
+   * Clear all tensors and metadata
+   */
+  clear(): void {
+    this.tensors.clear();
+    this.metadata = {};
+  }
+}
+
+/**
+ * SafeTensors Reader
+ *
+ * Reads tensors from SafeTensors format.
+ */
+export class SafeTensorsReader {
+  private buffer: Uint8Array;
+  private header: Record<string, SafeTensorsHeader | Record<string, string>> = {};
+  private dataOffset: number = 0;
+
+  constructor(buffer: Uint8Array) {
+    this.buffer = buffer;
+    this.parseHeader();
+  }
+
+  /**
+   * Get tensor names
+   */
+  getTensorNames(): string[] {
+    return Object.keys(this.header).filter(k => k !== '__metadata__');
+  }
+
+  /**
+   * Get tensor by name
+   */
+  getTensor(name: string): { data: Float32Array; shape: number[] } | null {
+    const entry = this.header[name];
+    if (!entry || typeof entry === 'object' && 'dtype' in entry === false) {
+      return null;
+    }
+
+    const tensorHeader = entry as SafeTensorsHeader;
+    const [start, end] = tensorHeader.data_offsets;
+    const bytes = this.buffer.slice(this.dataOffset + start, this.dataOffset + end);
+
+    return {
+      data: new Float32Array(bytes.buffer, bytes.byteOffset, bytes.length / 4),
+      shape: tensorHeader.shape,
+    };
+  }
+
+  /**
+   * Get tensor as 2D array
+   */
+  getTensor2D(name: string): number[][] | null {
+    const tensor = this.getTensor(name);
+    if (!tensor || tensor.shape.length !== 2) return null;
+
+    const [rows, cols] = tensor.shape;
+    const result: number[][] = [];
+
+    for (let i = 0; i < rows; i++) {
+      const row: number[] = [];
+      for (let j = 0; j < cols; j++) {
+        row.push(tensor.data[i * cols + j]);
+      }
+      result.push(row);
+    }
+
+    return result;
+  }
+
+  /**
+   * Get tensor as 1D array
+   */
+  getTensor1D(name: string): number[] | null {
+    const tensor = this.getTensor(name);
+    if (!tensor) return null;
+    return Array.from(tensor.data);
+  }
+
+  /**
+   * Get metadata
+   */
+  getMetadata(): Record<string, string> {
+    const meta = this.header['__metadata__'];
+    if (!meta || typeof meta !== 'object') return {};
+    return meta as Record<string, string>;
+  }
+
+  private parseHeader(): void {
+    const view = new DataView(this.buffer.buffer, this.buffer.byteOffset);
+    const headerLength = Number(view.getBigUint64(0, true));
+
+    const headerBytes = this.buffer.slice(8, 8 + headerLength);
+    const headerJson = new TextDecoder().decode(headerBytes);
+    this.header = JSON.parse(headerJson.replace(/\0+$/, '')); // Remove padding nulls
+
+    this.dataOffset = 8 + headerLength;
+  }
+}
+
+/**
+ * Model Exporter
+ *
+ * Unified export interface for SONA models.
+ */
+export class ModelExporter {
+  /**
+   * Export to SafeTensors format
+   */
+  toSafeTensors(model: ExportableModel): Uint8Array {
+    const writer = new SafeTensorsWriter();
+
+    // Add metadata
+    writer.addMetadata('name', model.metadata.name);
+    writer.addMetadata('version', model.metadata.version);
+    writer.addMetadata('architecture', model.metadata.architecture);
+
+    if (model.metadata.training) {
+      writer.addMetadata('training_steps', String(model.metadata.training.steps));
+      writer.addMetadata('training_loss', String(model.metadata.training.loss));
+    }
+
+    // Add LoRA weights
+    if (model.loraWeights) {
+      writer.add2D('lora.A', model.loraWeights.loraA);
+      writer.add2D('lora.B', model.loraWeights.loraB);
+      writer.add1D('lora.scaling', [model.loraWeights.scaling]);
+    }
+
+    // Add patterns as embeddings
+    if (model.patterns && model.patterns.length > 0) {
+      const embeddings: number[][] = model.patterns.map(p => p.embedding);
+      writer.add2D('patterns.embeddings', embeddings);
+
+      const successRates = model.patterns.map(p => p.successRate);
+      writer.add1D('patterns.success_rates', successRates);
+    }
+
+    // Add raw tensors
+    if (model.tensors) {
+      for (const [name, data] of model.tensors) {
+        writer.addTensor(name, data, [data.length]);
+      }
+    }
+
+    return writer.build();
+  }
+
+  /**
+   * Export to JSON format
+   */
+  toJSON(model: ExportableModel): string {
+    return JSON.stringify({
+      metadata: model.metadata,
+      loraConfig: model.loraConfig,
+      loraWeights: model.loraWeights,
+      patterns: model.patterns,
+      ewcStats: model.ewcStats,
+    }, null, 2);
+  }
+
+  /**
+   * Export to compact binary format
+   */
+  toBinary(model: ExportableModel): Uint8Array {
+    const json = this.toJSON(model);
+    const jsonBytes = new TextEncoder().encode(json);
+
+    // Simple format: [4-byte length][json bytes]
+    const buffer = new Uint8Array(4 + jsonBytes.length);
+    const view = new DataView(buffer.buffer);
+    view.setUint32(0, jsonBytes.length, true);
+    buffer.set(jsonBytes, 4);
+
+    return buffer;
+  }
+
+  /**
+   * Export for HuggingFace Hub compatibility
+   */
+  toHuggingFace(model: ExportableModel): {
+    safetensors: Uint8Array;
+    config: string;
+    readme: string;
+  } {
+    const safetensors = this.toSafeTensors(model);
+
+    const config = JSON.stringify({
+      model_type: 'sona-lora',
+      ...model.metadata,
+      lora_config: model.loraConfig,
+    }, null, 2);
+
+    const readme = `---
+license: mit
+tags:
+- sona
+- lora
+- ruvector
+---
+
+# ${model.metadata.name}
+
+${model.metadata.architecture} model trained with SONA adaptive learning.
+
+## Usage
+
+\`\`\`typescript
+import { LoraAdapter, SafeTensorsReader } from '@ruvector/ruvllm';
+
+const reader = new SafeTensorsReader(buffer);
+const adapter = new LoraAdapter();
+adapter.setWeights({
+  loraA: reader.getTensor2D('lora.A'),
+  loraB: reader.getTensor2D('lora.B'),
+  scaling: reader.getTensor1D('lora.scaling')[0],
+});
+\`\`\`
+
+## Training Info
+
+- Steps: ${model.metadata.training?.steps || 'N/A'}
+- Final Loss: ${model.metadata.training?.loss || 'N/A'}
+`;
+
+    return { safetensors, config, readme };
+  }
+}
+
+/**
+ * Model Importer
+ *
+ * Import models from various formats.
+ */
+export class ModelImporter {
+  /**
+   * Import from SafeTensors format
+   */
+  fromSafeTensors(buffer: Uint8Array): Partial<ExportableModel> {
+    const reader = new SafeTensorsReader(buffer);
+    const metadata = reader.getMetadata();
+
+    const result: Partial<ExportableModel> = {
+      metadata: {
+        name: metadata.name || 'unknown',
+        version: metadata.version || '1.0.0',
+        architecture: metadata.architecture || 'sona-lora',
+        training: metadata.training_steps ? {
+          steps: parseInt(metadata.training_steps),
+          loss: parseFloat(metadata.training_loss || '0'),
+          learningRate: 0,
+        } : undefined,
+      },
+    };
+
+    // Load LoRA weights
+    const loraA = reader.getTensor2D('lora.A');
+    const loraB = reader.getTensor2D('lora.B');
+    const loraScaling = reader.getTensor1D('lora.scaling');
+
+    if (loraA && loraB && loraScaling) {
+      result.loraWeights = {
+        loraA,
+        loraB,
+        scaling: loraScaling[0],
+      };
+    }
+
+    // Load patterns
+    const patternEmbeddings = reader.getTensor2D('patterns.embeddings');
+    const patternRates = reader.getTensor1D('patterns.success_rates');
+
+    if (patternEmbeddings && patternRates) {
+      result.patterns = patternEmbeddings.map((embedding, i) => ({
+        id: `imported-${i}`,
+        type: 'query_response' as const,
+        embedding,
+        successRate: patternRates[i] || 0,
+        useCount: 0,
+        lastUsed: new Date(),
+      }));
+    }
+
+    return result;
+  }
+
+  /**
+   * Import from JSON format
+   */
+  fromJSON(json: string): Partial<ExportableModel> {
+    return JSON.parse(json);
+  }
+
+  /**
+   * Import from binary format
+   */
+  fromBinary(buffer: Uint8Array): Partial<ExportableModel> {
+    const view = new DataView(buffer.buffer, buffer.byteOffset);
+    const length = view.getUint32(0, true);
+    const jsonBytes = buffer.slice(4, 4 + length);
+    const json = new TextDecoder().decode(jsonBytes);
+    return this.fromJSON(json);
+  }
+}
+
+/**
+ * Dataset Exporter
+ *
+ * Export training data in various formats.
+ */
+export class DatasetExporter {
+  /**
+   * Export to JSONL format (one JSON per line)
+   */
+  toJSONL(data: Array<{ input: Embedding; output: Embedding; quality: number }>): string {
+    return data
+      .map(item => JSON.stringify({
+        input: item.input,
+        output: item.output,
+        quality: item.quality,
+      }))
+      .join('\n');
+  }
+
+  /**
+   * Export to CSV format
+   */
+  toCSV(data: Array<{ input: Embedding; output: Embedding; quality: number }>): string {
+    const header = 'quality,input,output';
+    const rows = data.map(item =>
+      `${item.quality},"${item.input.join(',')}","${item.output.join(',')}"`
+    );
+    return [header, ...rows].join('\n');
+  }
+
+  /**
+   * Export patterns for pre-training
+   */
+  toPretrain(patterns: LearnedPattern[]): string {
+    return patterns
+      .filter(p => p.successRate >= 0.7)
+      .map(p => JSON.stringify({
+        embedding: p.embedding,
+        type: p.type,
+        quality: p.successRate,
+      }))
+      .join('\n');
+  }
+}