Tag: ollama

AI-News

Local-LLM-Ökosystem News: Ollama 0.30, llama.cpp Sicherheitsflaws, Gemma 4 & Nemotron 3 Ultra

🚀 Releases Ollama 0.30.x (5. Juni 2026) – Mit verbesserter GGUF-Kompatibilität durch llama.cpp. 0.30.6 führt Gemma 4 QAT-gewichte ein (4 Größen mit Quantization-Aware Training), verbessertes MLX-Embedding auf Apple Silicon mit NVFP4 global scale. 0.30.5 behebt Gemma 4 12B Floating-Point-Exception auf x86/CUDA/Linux/Windows. 0.30.4 bringt Nemotron 3 Ultra, Multi-Modal-GPU-Offload auf Apple Silicon, und das ollama launch-Ökosystem ist […]

Mehr lesen →
AI-News

Local-LLM News: Ollama 0.30, Nemotron 3 Ultra, Gemma 4 12B & Sicherheitswarnungen (6. Juni 2026)

🚀 Releases Ollama 0.30 (5. Juni 2026) Die neueste Version bringt verbesserte Performance und erweiterte GGUF-Modellkompatibilität durch llama.cpp-Integration. Highlights: NVIDIA-Hardware: bis zu 20% schneller (getestet mit Gemma 4 26B, Q4_K_M auf RTX 5090) Vulkan standardmäßig aktiviert — GPU-Beschleunigung jetzt auf AMD und Intel Geräten ohne zusätzliche Vendor-Libraries Erweiterte GGUF-Ökosystem-Unterstützung: LFM, Prism, Unsloth-feinabgestimmte Modelle jetzt direkt […]

Mehr lesen →
AI-News

Local-LLM-Roundup: Woche vom 30. Mai – 6. Juni 2026

🚀 Releases Ollama 0.30 (5. Juni 2026) Verbesserte Performance und GGUF-Kompatibilität: Ollama 0.30 bringt bis zu 20% schnellere Inferenz auf NVIDIA-Hardware (getestet mit Gemma 4 26B auf RTX 5090) und erweitert Vulkan-Unterstützung für AMD und Intel GPUs. Das Release augmentiert die MLX-Engine auf Apple Silicon und ermöglicht direktes Laden von GGUF-Dateien von Hugging Face mit […]

Mehr lesen →
AI-News

Local-LLM News vom 6. Juni 2026: Ollama 0.30, LlamaStash, Gemma 4 und Nemotron 3 Ultra

🚀 Releases Ollama 0.30 (5. Juni 2026) – Verbesserte Performance und GGUF-Modellunterstützung Die neue Version bringt bis zu 20% schnellere Durchsätze auf NVIDIA-Hardware, erweiterte GPU-Unterstützung durch standardmäßig aktiviertes Vulkan, und native GGUF-Modelkompatibilität durch die Integration von llama.cpp. Nutzer können nun beliebige GGUF-Dateien von Hugging Face verwenden, auch von Unsloth-Quantisierungen. Apple-Silicon-Nutzer profitieren von erweiterten MLX-Engine-Optimierungen. Zudem […]

Mehr lesen →
KI

Local-LLM News Roundup – 28. Mai 2026

Ollama 0.24 bringt die Codex App, eine kritische GGUF-Speicherleck-Schwachstelle (CVE-2026-7482) wird aktiv ausgenutzt, llama.cpp veröffentlicht täglich neue Builds, und gpt-oss von OpenAI ist jetzt lokal via Ollama und llama.cpp nutzbar.

Mehr lesen →