Agent Ops: artifacts, memory, long context, sandboxes, repo context

Two new Showboat tools: Chartroom and datasette-showboat adds remote streaming — Chartroom and datasette-showboat let coding agents publish live demo documents and charts directly to a Datasette endpoint. That gives agents a simple path to ship executable, inspectable artifacts and live demos that improve validation and cross-team handoff (Principle 08).

The Multi-Model Database for AI Agents: Deploy SurrealDB with Docker Extension unifies vectors, graphs, documents, and relational data in one low-latency engine and ships a Docker extension to simplify deployment. For outcome engineers this collapses memory, graph, and RAG plumbing into a single operational store, reducing context fragmentation and latency for agent decisions (Principle 11).

Evaluating AGENTS.md: Are Repository-Level Context Files Helpful for Coding Agents? finds repository-level AGENTS.md files often reduce coding agents’ task success and raise inference cost, advising restraint in repo-level context. Takeaway: curate small, high-signal context and measure inference cost—dump-all repo context harms performance and observability (Principles 06, 16).

Anthropic launches Claude Sonnet 4.6 with coding and consistency improvements, plus 1M-token context window in beta rolls out coding and consistency upgrades and a beta 1M-token context window. That expands agent working memory substantially—rethink your context-slicing, state management, and proof-of-correctness pipelines when agents can operate over million-token contexts (Principle 06).

Running NanoClaw in a Docker Shell Sandbox shows how to run NanoClaw inside Docker shell sandboxes to isolate files, protect API keys, and safely deploy a WhatsApp AI assistant. It provides a concrete sandbox + credential-proxy pattern you can adopt to reduce blast radius and meet Gate/Immune System requirements for agent deployments (Principles 07, 10).