Local-LLM-Ökosystem News: Ollama 0.30, llama.cpp Sicherheitsflaws, Gemma 4 & Nemotron 3 Ultra
🚀 Releases Ollama 0.30.x (5. Juni 2026) – Mit verbesserter GGUF-Kompatibilität durch llama.cpp. 0.30.6 führt Gemma 4 QAT-gewichte ein (4 Größen mit Quantization-Aware Training), verbessertes MLX-Embedding auf Apple Silicon mit NVFP4 global scale. 0.30.5 behebt Gemma 4 12B Floating-Point-Exception auf x86/CUDA/Linux/Windows. 0.30.4 bringt Nemotron 3 Ultra, Multi-Modal-GPU-Offload auf Apple Silicon, und das ollama launch-Ökosystem ist […]