From a060b4ba17a18b448101480c12d7cecfe4d5775a Mon Sep 17 00:00:00 2001
From: Yuwei An <ayw.sirius19@gmail.com>
Date: Thu, 2 Apr 2026 15:40:04 -0700
Subject: [PATCH 01/10] vllm block event (#2930)

* fix

Signed-off-by: Oasis-Git <ayw.sirius19@gmail.com>

* fix

Signed-off-by: Oasis-Git <ayw.sirius19@gmail.com>

---------

Signed-off-by: Oasis-Git <ayw.sirius19@gmail.com>
---
 .../vllm/vllm_multi_process_adapter.py        | 23 ++++++++
 lmcache/v1/mp_observability/event.py          |  3 +
 .../subscribers/logging/mp_server.py          | 14 +++++
 lmcache/v1/multiprocess/custom_types.py       |  9 +++
 lmcache/v1/multiprocess/protocols/__init__.py | 10 +++-
 lmcache/v1/multiprocess/protocols/base.py     |  3 +
 .../multiprocess/protocols/observability.py   | 36 +++++++++++
 lmcache/v1/multiprocess/server.py             | 21 +++++++
 tests/v1/mp_observability/test_event_bus.py   | 57 ++++++++++++++++++
 tests/v1/multiprocess/test_custom_types.py    | 43 ++++++++++++++
 tests/v1/multiprocess/test_mq.py              | 59 ++++++++++++++++++-
 .../multiprocess/test_mq_handler_helpers.py   | 32 +++++++++-
 12 files changed, 307 insertions(+), 3 deletions(-)
 create mode 100644 lmcache/v1/multiprocess/protocols/observability.py

diff --git a/lmcache/integration/vllm/vllm_multi_process_adapter.py b/lmcache/integration/vllm/vllm_multi_process_adapter.py
index 64289545cc..588ac0774e 100644
--- a/lmcache/integration/vllm/vllm_multi_process_adapter.py
+++ b/lmcache/integration/vllm/vllm_multi_process_adapter.py
@@ -14,6 +14,7 @@
 from lmcache.integration.request_telemetry.factory import RequestTelemetryFactory
 from lmcache.utils import _lmcache_nvtx_annotate, init_logger
 from lmcache.v1.multiprocess.custom_types import (
+    BlockAllocationRecord,
     CudaIPCWrapper,
     IPCCacheEngineKey,
     KVCache,
@@ -447,6 +448,28 @@ def end_session(self, request_id: str) -> None:
             [request_id],
         )
 
+    def report_block_allocations(
+        self,
+        records: list[BlockAllocationRecord],
+    ) -> None:
+        """Report vLLM GPU block allocation deltas to LMCache server.
+
+        Fire-and-forget: does not wait for a response. If the server
+        is unhealthy the report is silently dropped.
+
+        Args:
+            records: List of BlockAllocationRecord with per-request
+                block and token allocation deltas.
+        """
+        if not self.is_healthy or not records:
+            return
+
+        send_lmcache_request(
+            self.mq_client,
+            RequestType.REPORT_BLOCK_ALLOCATION,
+            [records],
+        )
+
     # Helper functions
     def _create_key(
         self,
diff --git a/lmcache/v1/mp_observability/event.py b/lmcache/v1/mp_observability/event.py
index b4d50a52d4..ea018b6aca 100644
--- a/lmcache/v1/mp_observability/event.py
+++ b/lmcache/v1/mp_observability/event.py
@@ -50,6 +50,9 @@ class EventType(Enum):
     MP_LOOKUP_PREFETCH_START = "mp.lookup_prefetch.start"
     MP_LOOKUP_PREFETCH_END = "mp.lookup_prefetch.end"
 
+    # vLLM block allocation events
+    MP_VLLM_BLOCK_ALLOCATION = "mp.vllm.block_allocation"
+
 
 @dataclass
 class Event:
diff --git a/lmcache/v1/mp_observability/subscribers/logging/mp_server.py b/lmcache/v1/mp_observability/subscribers/logging/mp_server.py
index 23360dc6d6..b2b0174cdc 100644
--- a/lmcache/v1/mp_observability/subscribers/logging/mp_server.py
+++ b/lmcache/v1/mp_observability/subscribers/logging/mp_server.py
@@ -30,6 +30,7 @@ def get_subscriptions(self) -> dict[EventType, EventCallback]:
             EventType.MP_RETRIEVE_END: self._on_retrieve_end,
             EventType.MP_LOOKUP_PREFETCH_START: self._on_lookup_prefetch_start,
             EventType.MP_LOOKUP_PREFETCH_END: self._on_lookup_prefetch_end,
+            EventType.MP_VLLM_BLOCK_ALLOCATION: self._on_block_allocation,
         }
 
     def _on_store_start(self, event: Event) -> None:
@@ -74,3 +75,16 @@ def _on_lookup_prefetch_end(self, event: Event) -> None:
             event.session_id,
             event.metadata.get("found_count"),
         )
+
+    def _on_block_allocation(self, event: Event) -> None:
+        records = event.metadata.get("records", [])
+        for rec in records:
+            logger.debug(
+                "vLLM block allocation: req_id=%s "
+                "new_blocks=%d new_tokens=%d "
+                "block_ids=%s",
+                rec.req_id,
+                len(rec.new_block_ids),
+                len(rec.new_token_ids),
+                rec.new_block_ids[:10],
+            )
diff --git a/lmcache/v1/multiprocess/custom_types.py b/lmcache/v1/multiprocess/custom_types.py
index 28aeed18dc..38ca052cee 100644
--- a/lmcache/v1/multiprocess/custom_types.py
+++ b/lmcache/v1/multiprocess/custom_types.py
@@ -222,6 +222,15 @@ def ext_hook(code: int, data: bytes) -> Any:
     return msgspec.msgpack.Decoder(ext_hook=ext_hook, type=type)
 
 
+@dataclass
+class BlockAllocationRecord:
+    """A single per-request GPU block allocation delta from vLLM."""
+
+    req_id: str
+    new_block_ids: list[int]
+    new_token_ids: list[int]
+
+
 @dataclass
 class CBMatchResult:
     """Result of a sub-sequence match from BlendTokenRangeMatcher.
diff --git a/lmcache/v1/multiprocess/protocols/__init__.py b/lmcache/v1/multiprocess/protocols/__init__.py
index e06f605c9a..ed6ff22d4d 100644
--- a/lmcache/v1/multiprocess/protocols/__init__.py
+++ b/lmcache/v1/multiprocess/protocols/__init__.py
@@ -9,7 +9,14 @@
 """
 
 # First Party
-from lmcache.v1.multiprocess.protocols import blend, blend_v2, controller, debug, engine
+from lmcache.v1.multiprocess.protocols import (
+    blend,
+    blend_v2,
+    controller,
+    debug,
+    engine,
+    observability,
+)
 from lmcache.v1.multiprocess.protocols.base import (
     HandlerType,
     ProtocolDefinition,
@@ -29,6 +36,7 @@ class ProtocolInitializationError(Exception):
     ("debug", debug),
     ("blend", blend),
     ("blend_v2", blend_v2),
+    ("observability", observability),
 ]
 
 
diff --git a/lmcache/v1/multiprocess/protocols/base.py b/lmcache/v1/multiprocess/protocols/base.py
index f743b57a60..383a41ff8c 100644
--- a/lmcache/v1/multiprocess/protocols/base.py
+++ b/lmcache/v1/multiprocess/protocols/base.py
@@ -54,6 +54,9 @@ class RequestType(enum.Enum):
     GET_CHUNK_SIZE = enum.auto()
     PING = enum.auto()
 
+    # Observability operations
+    REPORT_BLOCK_ALLOCATION = enum.auto()
+
     # Debug operations
     NOOP = enum.auto()
 
diff --git a/lmcache/v1/multiprocess/protocols/observability.py b/lmcache/v1/multiprocess/protocols/observability.py
new file mode 100644
index 0000000000..add73ed0e0
--- /dev/null
+++ b/lmcache/v1/multiprocess/protocols/observability.py
@@ -0,0 +1,36 @@
+# SPDX-License-Identifier: Apache-2.0
+"""
+Observability protocol definitions.
+
+This module defines protocols for:
+- REPORT_BLOCK_ALLOCATION: Report vLLM GPU block allocation events
+  (fire-and-forget, no response)
+"""
+
+# First Party
+from lmcache.v1.multiprocess.custom_types import BlockAllocationRecord
+from lmcache.v1.multiprocess.protocols.base import HandlerType, ProtocolDefinition
+
+# Define request names for this protocol group
+REQUEST_NAMES = [
+    "REPORT_BLOCK_ALLOCATION",
+]
+
+
+def get_protocol_definitions() -> dict[str, ProtocolDefinition]:
+    """
+    Returns protocol definitions for observability operations.
+
+    Returns:
+        Dictionary mapping request names to their protocol definitions
+    """
+    return {
+        # Report vLLM block allocation
+        # Payload: [list[BlockAllocationRecord]] - list of allocation records
+        # Returns: None (fire-and-forget)
+        "REPORT_BLOCK_ALLOCATION": ProtocolDefinition(
+            payload_classes=[list[BlockAllocationRecord]],
+            response_class=None,
+            handler_type=HandlerType.BLOCKING,
+        ),
+    }
diff --git a/lmcache/v1/multiprocess/server.py b/lmcache/v1/multiprocess/server.py
index 64b901f438..aad74041ae 100644
--- a/lmcache/v1/multiprocess/server.py
+++ b/lmcache/v1/multiprocess/server.py
@@ -45,6 +45,7 @@
     parse_args_to_mp_server_config,
 )
 from lmcache.v1.multiprocess.custom_types import (
+    BlockAllocationRecord,
     IPCCacheEngineKey,
     KVCache,
 )
@@ -819,6 +820,20 @@ def report_status(self) -> dict:
             "storage_manager": sm,
         }
 
+    def report_block_allocations(self, records: list[BlockAllocationRecord]) -> None:
+        """Publish vLLM block allocation records to the EventBus.
+
+        Args:
+            records: List of BlockAllocationRecord with per-request
+                block and token allocation deltas.
+        """
+        self._event_bus.publish(
+            Event(
+                event_type=EventType.MP_VLLM_BLOCK_ALLOCATION,
+                metadata={"records": records},
+            )
+        )
+
     def debug(self) -> str:
         return "OK"
 
@@ -914,6 +929,11 @@ def run_cache_server(
     add_handler_helper(server, RequestType.PING, engine.ping)
     add_handler_helper(server, RequestType.END_SESSION, engine.end_session)
     add_handler_helper(server, RequestType.NOOP, engine.debug)
+    add_handler_helper(
+        server,
+        RequestType.REPORT_BLOCK_ALLOCATION,
+        engine.report_block_allocations,
+    )
 
     # Assign thread pools
     server.add_affinity_thread_pool(
@@ -929,6 +949,7 @@ def run_cache_server(
             RequestType.END_SESSION,
             RequestType.CLEAR,
             RequestType.PING,
+            RequestType.REPORT_BLOCK_ALLOCATION,
         ],
         max_workers=mp_config.max_cpu_workers,
     )
diff --git a/tests/v1/mp_observability/test_event_bus.py b/tests/v1/mp_observability/test_event_bus.py
index 3ee1b4f9f3..45e26a63aa 100644
--- a/tests/v1/mp_observability/test_event_bus.py
+++ b/tests/v1/mp_observability/test_event_bus.py
@@ -334,3 +334,60 @@ def test_init_with_none_uses_defaults(self):
         bus = init_event_bus()
         assert bus._config.enabled is True
         assert bus._config.max_queue_size == 10_000
+
+
+# ---------------------------------------------------------------------------
+# Block allocation event
+# ---------------------------------------------------------------------------
+
+
+class TestBlockAllocationEvent:
+    def test_publish_block_allocation_event(self, bus):
+        """Verify MP_VLLM_BLOCK_ALLOCATION events are delivered to subscribers."""
+        sub = _RecordingSubscriber(event_types=[EventType.MP_VLLM_BLOCK_ALLOCATION])
+        bus.register_subscriber(sub)
+        bus.start()
+
+        # First Party
+        from lmcache.v1.multiprocess.custom_types import BlockAllocationRecord
+
+        records = [
+            BlockAllocationRecord(
+                req_id="req-1",
+                new_block_ids=[0, 1, 2],
+                new_token_ids=[10, 20, 30],
+            ),
+        ]
+        bus.publish(
+            _make_event(
+                event_type=EventType.MP_VLLM_BLOCK_ALLOCATION,
+                session_id="",
+                records=records,
+            )
+        )
+        time.sleep(0.15)
+        bus.stop()
+
+        assert len(sub.events) == 1
+        evt = sub.events[0]
+        assert evt.event_type == EventType.MP_VLLM_BLOCK_ALLOCATION
+        assert len(evt.metadata["records"]) == 1
+        assert evt.metadata["records"][0].req_id == "req-1"
+        assert evt.metadata["records"][0].new_block_ids == [0, 1, 2]
+
+    def test_block_allocation_not_delivered_to_other_subscriber(self, bus):
+        """Verify block allocation events are not delivered to unrelated subscribers."""
+        sub = _RecordingSubscriber(event_types=[EventType.L1_READ_FINISHED])
+        bus.register_subscriber(sub)
+        bus.start()
+
+        bus.publish(
+            _make_event(
+                event_type=EventType.MP_VLLM_BLOCK_ALLOCATION,
+                session_id="",
+            )
+        )
+        time.sleep(0.15)
+        bus.stop()
+
+        assert len(sub.events) == 0
diff --git a/tests/v1/multiprocess/test_custom_types.py b/tests/v1/multiprocess/test_custom_types.py
index aefe2396f3..30f102de5e 100644
--- a/tests/v1/multiprocess/test_custom_types.py
+++ b/tests/v1/multiprocess/test_custom_types.py
@@ -10,6 +10,7 @@
 
 # First Party
 from lmcache.v1.multiprocess.custom_types import (
+    BlockAllocationRecord,
     CudaIPCWrapper,
     IPCCacheEngineKey,
     get_customized_decoder,
@@ -219,3 +220,45 @@ def test_cudaipc_wrapper_multiprocess_serialization():
             f"Tensor {i}: post-modification checksum mismatch. "
             f"Expected {new_expected_checksum}, got {actual_checksum}"
         )
+
+
+def test_block_allocation_record_serialization():
+    """Test encoding and decoding of BlockAllocationRecord using msgspec."""
+    original = BlockAllocationRecord(
+        req_id="req-42",
+        new_block_ids=[10, 20, 30],
+        new_token_ids=[100, 200, 300, 400],
+    )
+
+    encoded = msgspec.msgpack.encode(original)
+    decoded = msgspec.msgpack.decode(encoded, type=BlockAllocationRecord)
+
+    assert decoded.req_id == original.req_id
+    assert decoded.new_block_ids == original.new_block_ids
+    assert decoded.new_token_ids == original.new_token_ids
+
+
+def test_block_allocation_record_list_serialization():
+    """Test encoding and decoding of a list of BlockAllocationRecord."""
+    records = [
+        BlockAllocationRecord(
+            req_id="req-1",
+            new_block_ids=[1, 2],
+            new_token_ids=[10, 20, 30],
+        ),
+        BlockAllocationRecord(
+            req_id="req-2",
+            new_block_ids=[],
+            new_token_ids=[40, 50],
+        ),
+    ]
+
+    encoded = msgspec.msgpack.encode(records)
+    decoded = msgspec.msgpack.decode(encoded, type=list[BlockAllocationRecord])
+
+    assert len(decoded) == 2
+    assert decoded[0].req_id == "req-1"
+    assert decoded[0].new_block_ids == [1, 2]
+    assert decoded[1].req_id == "req-2"
+    assert decoded[1].new_block_ids == []
+    assert decoded[1].new_token_ids == [40, 50]
diff --git a/tests/v1/multiprocess/test_mq.py b/tests/v1/multiprocess/test_mq.py
index 3dd1e36871..fce8763852 100644
--- a/tests/v1/multiprocess/test_mq.py
+++ b/tests/v1/multiprocess/test_mq.py
@@ -12,7 +12,11 @@
 import zmq
 
 # First Party
-from lmcache.v1.multiprocess.custom_types import CudaIPCWrapper, IPCCacheEngineKey
+from lmcache.v1.multiprocess.custom_types import (
+    BlockAllocationRecord,
+    CudaIPCWrapper,
+    IPCCacheEngineKey,
+)
 from lmcache.v1.multiprocess.mq import (
     BlockingRequestHandler,
     MessageQueueClient,
@@ -533,6 +537,59 @@ def test_mq_lookup_with_different_key():
     )
 
 
+def test_mq_report_block_allocation():
+    """
+    Test MessageQueue with REPORT_BLOCK_ALLOCATION request type.
+    REPORT_BLOCK_ALLOCATION takes (records: list[BlockAllocationRecord])
+    and returns None.
+    """
+    records = [
+        BlockAllocationRecord(
+            req_id="req-1",
+            new_block_ids=[0, 1, 2],
+            new_token_ids=[100, 200, 300],
+        ),
+        BlockAllocationRecord(
+            req_id="req-2",
+            new_block_ids=[3, 4],
+            new_token_ids=[400, 500],
+        ),
+    ]
+
+    helper = MessageQueueTestHelper(server_url="tcp://127.0.0.1:5566")
+    helper.register_handler(
+        RequestType.REPORT_BLOCK_ALLOCATION,
+        test_mq_handler_helpers.report_block_allocations_handler,
+    )
+
+    helper.run_test(
+        request_type=RequestType.REPORT_BLOCK_ALLOCATION,
+        payloads=[records],
+        expected_response=None,
+        num_requests=1,
+    )
+
+
+def test_mq_report_block_allocation_empty():
+    """
+    Test REPORT_BLOCK_ALLOCATION with an empty records list.
+    """
+    records: list[BlockAllocationRecord] = []
+
+    helper = MessageQueueTestHelper(server_url="tcp://127.0.0.1:5567")
+    helper.register_handler(
+        RequestType.REPORT_BLOCK_ALLOCATION,
+        test_mq_handler_helpers.report_block_allocations_handler,
+    )
+
+    helper.run_test(
+        request_type=RequestType.REPORT_BLOCK_ALLOCATION,
+        payloads=[records],
+        expected_response=None,
+        num_requests=1,
+    )
+
+
 # ==============================================================================
 # Thread Pool Tests
 # ==============================================================================
diff --git a/tests/v1/multiprocess/test_mq_handler_helpers.py b/tests/v1/multiprocess/test_mq_handler_helpers.py
index 241fb7af23..df083be463 100644
--- a/tests/v1/multiprocess/test_mq_handler_helpers.py
+++ b/tests/v1/multiprocess/test_mq_handler_helpers.py
@@ -8,7 +8,7 @@
 
 # First Party
 from lmcache.v1.gpu_connector.utils import LayoutHints
-from lmcache.v1.multiprocess.custom_types import KVCache
+from lmcache.v1.multiprocess.custom_types import BlockAllocationRecord, KVCache
 from lmcache.v1.multiprocess.protocol import KeyType
 
 # ==============================================================================
@@ -201,3 +201,33 @@ def free_locks_handler(key: KeyType, tp_size: int) -> None:
     """
     assert isinstance(key, KeyType), f"Expected key to be KeyType, got {type(key)}"
     assert isinstance(tp_size, int), f"Expected tp_size to be int, got {type(tp_size)}"
+
+
+# ==============================================================================
+# REPORT_BLOCK_ALLOCATION Request Handlers
+# ==============================================================================
+
+
+def report_block_allocations_handler(
+    records: list[BlockAllocationRecord],
+) -> None:
+    """
+    Dummy handler for REPORT_BLOCK_ALLOCATION requests.
+
+    Args:
+        records: List of BlockAllocationRecord with per-request
+            block and token allocation deltas.
+
+    Returns:
+        None
+    """
+    assert isinstance(records, list), (
+        f"Expected records to be list, got {type(records)}"
+    )
+    for rec in records:
+        assert isinstance(rec, BlockAllocationRecord), (
+            f"Expected BlockAllocationRecord, got {type(rec)}"
+        )
+        assert isinstance(rec.req_id, str)
+        assert isinstance(rec.new_block_ids, list)
+        assert isinstance(rec.new_token_ids, list)

From f7c306f3af7c1927b1872985f2765fa5e63e053f Mon Sep 17 00:00:00 2001
From: Samuel Shen <slshen@tensormesh.ai>
Date: Thu, 2 Apr 2026 18:22:58 -0700
Subject: [PATCH 02/10] [Feat]: Add eviction to L2 Native Backend (#2939)

* Add submit_batch_delete to native connector stack for L2 eviction

Adds a DELETE operation through all layers of the native connector
framework (C++ IStorageConnector -> ConnectorBase -> pybind -> Python
NativeConnectorL2Adapter) so that native remote backends (Redis, FS,
plugins) can participate in L2 eviction.

C++ layer:
- Add BATCH_TILE_DELETE to Op enum
- Add submit_batch_delete to IStorageConnector interface
- Implement in ConnectorBase with tiling, per-key results, and
  per-key error tolerance (like GET)
- Add do_single_delete virtual with default no-op for backward compat
- Implement for Redis (RESP DEL) and FS (std::filesystem::remove)

Pybind layer:
- Add bind_submit_batch_delete template (keys-only, GIL release)
- Update LMCACHE_BIND_CONNECTOR_METHODS macro

Python layer:
- NativeConnectorL2Adapter.delete() submits batch delete and blocks
  on threading.Event until demux thread signals completion
- Backward compatible: detects submit_batch_delete via hasattr
- Fix missing super().__init__() call for listener support
- Add warning in native_plugin_l2_adapter for plugins without delete

Tests:
- Add submit_batch_delete to MockNativeConnector
- Add TestDeleteInterface: existing key, nonexistent, empty, batch
- Add TestDeleteBackwardCompatibility: no-op without the method

* Add client-side size tracking for NativeConnectorL2Adapter.get_usage()

Enables the L2EvictionController to automatically trigger eviction for
native remote backends by tracking stored bytes client-side.

- Track per-key sizes in _key_sizes dict, populated on store completion
- Increment _current_size_bytes on successful store, decrement on delete
- Idempotent: duplicate stores for same key don't double-count
- get_usage() returns usage fraction when max_capacity_bytes > 0,
  or (-1.0, -1.0) when not configured (preserves backward compat)

Add max_capacity_bytes config parameter to:
- NativeConnectorL2Adapter.__init__
- RESPL2AdapterConfig, FSNativeL2AdapterConfig, NativePluginL2AdapterConfig
- All three factory functions

Tests: 6 new tests covering zero-capacity, store tracking, delete
tracking, store-delete cycles, and idempotent store deduplication.

* Update docs and examples for native connector eviction support

- l2_eviction.md: Update adapter support matrix to show
  NativeConnectorL2Adapter now supports delete and get_usage;
  add configuration example with max_capacity_bytes + eviction
- resp.rst: Add max_capacity_bytes to L2 adapter config table;
  add L2 Eviction section with full configuration example
- native_connectors.rst: Add do_single_delete to connector
  interface; add submit_batch_delete to protocol; add
  max_capacity_bytes to config examples and native_plugin table;
  update checklist and method counts
- resp/README.md: Add max_capacity_bytes to config table
- Config help() strings: Add max_capacity_bytes documentation
  to RESP, FS native, and native plugin adapter configs

* Rename max_capacity_bytes to max_capacity_gb (float) in config

Change the L2 adapter capacity config from bytes (int) to GB (float)
for consistency with MockL2Adapter's max_size_gb and better ergonomics.

The internal _max_capacity_bytes field stays as bytes -- the conversion
happens once in NativeConnectorL2Adapter.__init__.

Updated: adapter configs, factories, tests, docs, and examples.

* Fix eviction listener notifications and delete timeout cleanup

Fixes three issues found in code review:

1. (Critical) Add _notify_keys_stored on store completion and
   _notify_keys_accessed on load completion in the demux loop.
   Without these, the LRU eviction policy never learns about
   stored/accessed keys, making eviction non-functional.

2. Clean up _pending_delete_events and _pending_ops on delete
   timeout to prevent memory leaks.

3. Add docstring to delete() method.

Also store keys in _pending_ops for load operations (was None)
so _notify_keys_accessed can report which keys were loaded.

Listener notifications are fired outside the lock to avoid
potential deadlocks with listener callbacks.
---
 csrc/storage_backends/README.md               |  13 +-
 csrc/storage_backends/connector_base.h        |  61 ++++-
 csrc/storage_backends/connector_interface.h   |  18 ++
 .../storage_backends/connector_pybind_utils.h |  12 +
 csrc/storage_backends/connector_types.h       |   7 +-
 csrc/storage_backends/fs/connector.cpp        |   7 +
 csrc/storage_backends/fs/connector.h          |   1 +
 csrc/storage_backends/redis/connector.cpp     |  26 ++
 csrc/storage_backends/redis/connector.h       |   5 +-
 docs/design/l2_adapters/l2_eviction.md        |  27 ++-
 .../extending_lmcache/native_connectors.rst   |  44 +++-
 .../source/kv_cache/storage_backends/resp.rst |  39 +++
 .../remote_backends/resp/README.md            |   1 +
 .../csrc/connector.cpp                        |  13 +
 .../csrc/connector.h                          |   2 +
 .../l2_adapters/fs_native_l2_adapter.py       |  16 +-
 .../native_connector_l2_adapter.py            | 112 ++++++++-
 .../l2_adapters/native_plugin_l2_adapter.py   |  24 +-
 .../l2_adapters/resp_l2_adapter.py            |  16 +-
 .../test_native_connector_l2_adapter.py       | 227 ++++++++++++++++++
 20 files changed, 641 insertions(+), 30 deletions(-)

diff --git a/csrc/storage_backends/README.md b/csrc/storage_backends/README.md
index 6ce691d084..c50f7ee6da 100644
--- a/csrc/storage_backends/README.md
+++ b/csrc/storage_backends/README.md
@@ -49,7 +49,7 @@ Therefore the framework enforces:
 |------|---------|
 | `connector_types.h` | `Request`, `Completion`, `BatchState`, `Op` |
 | `connector_interface.h` | `IStorageConnector` — top-level abstract interface |
-| `connector_base.h` | `ConnectorBase<T>` — core harness (eventfd, SQ/CQ, threading, tiling). Override 4 methods per backend |
+| `connector_base.h` | `ConnectorBase<T>` — core harness (eventfd, SQ/CQ, threading, tiling). Override 4 required + 1 optional method per backend |
 | `connector_pybind_utils.h` | Pybind utilities with GIL release + `LMCACHE_BIND_CONNECTOR_METHODS` macro |
 | `redis/` | Reference implementation (RESP2 protocol over TCP) |
 
@@ -61,8 +61,8 @@ each step.
 ### Step 1: C++ connector — inherit from ConnectorBase
 
 Create your connector directory (e.g., `csrc/storage_backends/mybackend/`)
-and inherit from `ConnectorBase<YourConnectionType>`. You only need to
-override 4 methods:
+and inherit from `ConnectorBase<YourConnectionType>`. You need to
+override 4 required methods (and optionally `do_single_delete` for eviction):
 
 ```cpp
 // csrc/storage_backends/mybackend/connector.h
@@ -105,6 +105,11 @@ class MyConnector : public lmcache::connector::ConnectorBase<MyConn> {
     // send EXISTS, return true/false
   }
 
+  // Optional: delete a key (enables eviction support)
+  bool do_single_delete(MyConn& conn, const std::string& key) override {
+    // send DELETE, return true if deleted, false if not found
+  }
+
   // Optional: clean shutdown of connections
   void shutdown_connections() override { /* close sockets */ }
 
@@ -275,7 +280,7 @@ Python eventfd.
 
 ## Checklist for a new backend
 
-- [ ] C++ connector inheriting `ConnectorBase<T>` with 4 method overrides
+- [ ] C++ connector inheriting `ConnectorBase<T>` with 4 required + 1 optional (`do_single_delete`) method overrides
 - [ ] Pybind module using `LMCACHE_BIND_CONNECTOR_METHODS`
 - [ ] `setup.py` entry for the new `CppExtension`
 - [ ] Python client inheriting `ConnectorClientBase` (non-MP mode)
diff --git a/csrc/storage_backends/connector_base.h b/csrc/storage_backends/connector_base.h
index 11c1ead13c..ecf1229d83 100644
--- a/csrc/storage_backends/connector_base.h
+++ b/csrc/storage_backends/connector_base.h
@@ -25,6 +25,9 @@ this base needs to have at least four methods be overridden by the derived
 - 3. do_single_set()
 - 4. do_single_exists()
 
+optionally override do_single_delete() to support eviction (default returns
+false for all keys).
+
 see the RedisConnector (csrc/redis/) implementing the RESP2 protocol over TCP
 for an example
 */
@@ -130,6 +133,39 @@ class ConnectorBase : public IStorageConnector {
     return batch_future_id;
   }
 
+  uint64_t submit_batch_delete(const std::vector<std::string>& keys) override {
+    if (keys.empty()) {
+      throw std::runtime_error("keys list is empty");
+    }
+
+    size_t num_items = keys.size();
+    auto [batch_future_id, batch_state, num_tiles, tile_size] =
+        prepare_batch_operation(num_items, Op::BATCH_TILE_DELETE);
+
+    // pre-allocate per-key results (1 = deleted, 0 = not found)
+    batch_state->per_key_results.assign(num_items, 0);
+
+    // fan out work to threads
+    for (size_t tile_idx = 0; tile_idx < num_tiles; ++tile_idx) {
+      size_t start = tile_idx * tile_size;
+      size_t end = std::min(start + tile_size, num_items);
+
+      Request tile_req;
+      tile_req.op = Op::BATCH_TILE_DELETE;
+      tile_req.future_id = batch_future_id;
+      tile_req.batch = batch_state;
+      tile_req.start_idx = start;
+
+      for (size_t i = start; i < end; ++i) {
+        tile_req.keys.push_back(keys[i]);
+      }
+
+      enqueue_request(std::move(tile_req));
+    }
+
+    return batch_future_id;
+  }
+
   std::vector<Completion> drain_completions() override {
     // Drain the eventfd that triggered this drain_completions callback
     drain_eventfd_();
@@ -216,6 +252,11 @@ class ConnectorBase : public IStorageConnector {
                              size_t chunk_size) = 0;
   virtual bool do_single_exists(ConnectionType& conn,
                                 const std::string& key) = 0;
+  virtual bool do_single_delete(ConnectionType& conn, const std::string& key) {
+    (void)conn;
+    (void)key;
+    return false;  // no-op default for backward compat with plugins
+  }
   virtual void shutdown_connections() {}
 
   bool is_stopping() const { return stop_.load(std::memory_order_acquire); }
@@ -393,6 +434,23 @@ class ConnectorBase : public IStorageConnector {
               }
               comp.ok = true;
               break;
+
+            case Op::BATCH_TILE_DELETE:
+              for (size_t i = 0; i < req.keys.size(); ++i) {
+                try {
+                  bool deleted = do_single_delete(conn, req.keys[i]);
+                  req.batch->per_key_results[req.start_idx + i] =
+                      deleted ? 1 : 0;
+                } catch (const std::exception& e) {
+                  // Per-key error tolerance: record failure
+                  // but continue processing remaining keys
+                  req.batch->per_key_results[req.start_idx + i] = 0;
+                  fprintf(stderr, "[LMCache DELETE] key %s failed: %s\n",
+                          req.keys[i].c_str(), e.what());
+                }
+              }
+              comp.ok = true;
+              break;
           }
         } catch (const std::exception& e) {
           comp.ok = false;
@@ -438,7 +496,8 @@ class ConnectorBase : public IStorageConnector {
       }
       // for batch exists and batch get, move per-key results
       if (req.batch->batch_op == Op::BATCH_TILE_EXISTS ||
-          req.batch->batch_op == Op::BATCH_TILE_GET) {
+          req.batch->batch_op == Op::BATCH_TILE_GET ||
+          req.batch->batch_op == Op::BATCH_TILE_DELETE) {
         batch_comp.result_bytes = std::move(req.batch->per_key_results);
       }
       push_completion(std::move(batch_comp));
diff --git a/csrc/storage_backends/connector_interface.h b/csrc/storage_backends/connector_interface.h
index 9a8ac3ec9f..9f5de15aa8 100644
--- a/csrc/storage_backends/connector_interface.h
+++ b/csrc/storage_backends/connector_interface.h
@@ -80,6 +80,24 @@ class IStorageConnector {
   virtual uint64_t submit_batch_exists(
       const std::vector<std::string>& keys) = 0;
 
+  /*
+  submit a batch DELETE operation
+
+  deletes multiple keys in parallel. work is automatically divided
+  among worker threads (tiling). returns a single future_id for the entire
+  batch.
+
+  args:
+    keys: vector of key strings to delete
+
+  returns:
+    uint64_t: future id for tracking this batch operation
+    completion will contain result_bytes vector with 0/1 for each key
+    (1 = deleted, 0 = not found)
+  */
+  virtual uint64_t submit_batch_delete(
+      const std::vector<std::string>& keys) = 0;
+
   /*
   drain all available completions
 
diff --git a/csrc/storage_backends/connector_pybind_utils.h b/csrc/storage_backends/connector_pybind_utils.h
index 7e0c462317..f8c18563f6 100644
--- a/csrc/storage_backends/connector_pybind_utils.h
+++ b/csrc/storage_backends/connector_pybind_utils.h
@@ -36,6 +36,10 @@ example usage (see `redis/pybind.cpp`):
            lmcache::connector::pybind_utils::bind_submit_batch_exists< \
                ConnectorType>(),                                       \
            py::arg("keys"))                                            \
+      .def("submit_batch_delete",                                      \
+           lmcache::connector::pybind_utils::bind_submit_batch_delete< \
+               ConnectorType>(),                                       \
+           py::arg("keys"))                                            \
       .def("drain_completions",                                        \
            lmcache::connector::pybind_utils::bind_drain_completions<   \
                ConnectorType>())                                       \
@@ -113,6 +117,14 @@ auto bind_submit_batch_exists() {
   };
 }
 
+template <typename ConnectorType>
+auto bind_submit_batch_delete() {
+  return [](ConnectorType& self, const std::vector<std::string>& keys) {
+    py::gil_scoped_release release;
+    return self.submit_batch_delete(keys);
+  };
+}
+
 template <typename ConnectorType>
 auto bind_drain_completions() {
   return [](ConnectorType& self) {
diff --git a/csrc/storage_backends/connector_types.h b/csrc/storage_backends/connector_types.h
index e77a8665ac..35b5d75987 100644
--- a/csrc/storage_backends/connector_types.h
+++ b/csrc/storage_backends/connector_types.h
@@ -23,7 +23,12 @@ namespace connector {
 
 // we only support batched operations
 // benefits are fewer submissions and fewer completions
-enum class Op : uint8_t { BATCH_TILE_GET, BATCH_TILE_SET, BATCH_TILE_EXISTS };
+enum class Op : uint8_t {
+  BATCH_TILE_GET,
+  BATCH_TILE_SET,
+  BATCH_TILE_EXISTS,
+  BATCH_TILE_DELETE
+};
 
 /*
 shared communication state between threads executing a single batch operation.
diff --git a/csrc/storage_backends/fs/connector.cpp b/csrc/storage_backends/fs/connector.cpp
index db056a1e8c..0b12e2d1e4 100644
--- a/csrc/storage_backends/fs/connector.cpp
+++ b/csrc/storage_backends/fs/connector.cpp
@@ -271,5 +271,12 @@ bool FSConnector::do_single_exists(WorkerFSConn& conn, const std::string& key) {
   return std::filesystem::exists(file_path);
 }
 
+bool FSConnector::do_single_delete(WorkerFSConn& conn, const std::string& key) {
+  std::string filename = key_to_filename(key);
+  auto file_path = conn.base_path / filename;
+  std::error_code ec;
+  return std::filesystem::remove(file_path, ec);
+}
+
 }  // namespace connector
 }  // namespace lmcache
diff --git a/csrc/storage_backends/fs/connector.h b/csrc/storage_backends/fs/connector.h
index 02f95474ab..8f7fc7c8f6 100644
--- a/csrc/storage_backends/fs/connector.h
+++ b/csrc/storage_backends/fs/connector.h
@@ -46,6 +46,7 @@ class FSConnector : public ConnectorBase<WorkerFSConn> {
   void do_single_set(WorkerFSConn& conn, const std::string& key,
                      const void* buf, size_t len, size_t chunk_size) override;
   bool do_single_exists(WorkerFSConn& conn, const std::string& key) override;
+  bool do_single_delete(WorkerFSConn& conn, const std::string& key) override;
 
  private:
   // Build the filesystem-safe filename from a serialized key string.
diff --git a/csrc/storage_backends/redis/connector.cpp b/csrc/storage_backends/redis/connector.cpp
index 759ed191a6..320536c546 100644
--- a/csrc/storage_backends/redis/connector.cpp
+++ b/csrc/storage_backends/redis/connector.cpp
@@ -338,6 +338,32 @@ bool RedisConnector::do_single_exists(WorkerConn& conn,
   }
 }
 
+// RESP DEL
+bool RedisConnector::do_single_delete(WorkerConn& conn,
+                                      const std::string& key) {
+  // build key header using reusable buffer
+  const std::string& key_header = conn.make_key_header(key);
+
+  // send DEL cmd
+  conn.send_multipart({{conn.del_prefix.data(), conn.del_prefix.size()},
+                       {key_header.data(), key_header.size()}});
+
+  // parse response (either :0\r\n or :1\r\n, same format as EXISTS)
+  char response[WorkerConn::exists_response_len];
+  conn.recv_exactly(response, WorkerConn::exists_response_len);
+
+  if (std::memcmp(response, WorkerConn::exists_one.data(),
+                  WorkerConn::exists_response_len) == 0) {
+    return true;  // key was deleted
+  } else if (std::memcmp(response, WorkerConn::exists_zero.data(),
+                         WorkerConn::exists_response_len) == 0) {
+    return false;  // key did not exist
+  } else {
+    throw std::runtime_error(
+        "DEL returned invalid response that wasn't :0\r\n or :1\r\n");
+  }
+}
+
 void RedisConnector::shutdown_connections() {
   std::lock_guard<std::mutex> lk(worker_fds_mu_);
   for (int fd : worker_fds_) {
diff --git a/csrc/storage_backends/redis/connector.h b/csrc/storage_backends/redis/connector.h
index 0fb85dec76..778c7e8e18 100644
--- a/csrc/storage_backends/redis/connector.h
+++ b/csrc/storage_backends/redis/connector.h
@@ -34,6 +34,7 @@ struct WorkerConn {
   std::string get_prefix;
   std::string set_prefix;
   std::string exists_prefix;
+  std::string del_prefix;
 
   // reusable buffers for building headers (avoids repeated dynamic allocations)
   std::string key_header_buf;
@@ -53,7 +54,8 @@ struct WorkerConn {
   WorkerConn()
       : get_prefix("*2\r\n$3\r\nGET\r\n"),
         set_prefix("*3\r\n$3\r\nSET\r\n"),
-        exists_prefix("*2\r\n$6\r\nEXISTS\r\n") {
+        exists_prefix("*2\r\n$6\r\nEXISTS\r\n"),
+        del_prefix("*2\r\n$3\r\nDEL\r\n") {
     // pre-allocate key_header_buf to handle typical keys without reallocation
     // typical key format: model_name@world_size@worker_id@chunk_hash_hex@dtype
     // - model_name: 25-50 chars (e.g., "meta-llama/Llama-3-70b-instruct")
@@ -101,6 +103,7 @@ class RedisConnector : public ConnectorBase<WorkerConn> {
   void do_single_set(WorkerConn& conn, const std::string& key, const void* buf,
                      size_t len, size_t chunk_size) override;
   bool do_single_exists(WorkerConn& conn, const std::string& key) override;
+  bool do_single_delete(WorkerConn& conn, const std::string& key) override;
   void shutdown_connections() override;
 
  private:
diff --git a/docs/design/l2_adapters/l2_eviction.md b/docs/design/l2_adapters/l2_eviction.md
index af2ea4b8d7..c758a15bd9 100644
--- a/docs/design/l2_adapters/l2_eviction.md
+++ b/docs/design/l2_adapters/l2_eviction.md
@@ -197,7 +197,32 @@ capacity) can omit steps 2–6 and rely on the base class no-op defaults.
 | `MockL2Adapter`            | ✓        | ✓           | stored, deleted     |
 | `NixlStoreL2Adapter`       | ✓ (skips pinned) | ✓ (pool-based) | stored, deleted |
 | `FSL2Adapter`              | no-op    | `(-1, -1)`  | none                |
-| `NativeConnectorL2Adapter` | no-op    | `(-1, -1)`  | none                |
+| `NativeConnectorL2Adapter` | ✓ (via `submit_batch_delete`) | ✓ (client-side, requires `max_capacity_gb`) | stored, deleted |
+
+**Note on `NativeConnectorL2Adapter`:** Eviction support requires two things:
+
+1. The underlying C++ connector must implement `do_single_delete()` (built-in Redis
+   and FS connectors do; third-party plugins may not — in which case `delete()` is a
+   no-op).
+2. The adapter must be configured with `max_capacity_gb > 0` to enable client-side
+   size tracking for `get_usage()`. Without it, `get_usage()` returns `(-1, -1)` and
+   the eviction controller will not trigger.
+
+Example configuration with eviction enabled:
+
+```json
+{
+  "type": "resp",
+  "host": "localhost",
+  "port": 6379,
+  "max_capacity_gb": 10,
+  "eviction": {
+    "eviction_policy": "LRU",
+    "trigger_watermark": 0.8,
+    "eviction_ratio": 0.2
+  }
+}
+```
 
 ## Data Flow: Eviction Cycle
 
diff --git a/docs/source/developer_guide/extending_lmcache/native_connectors.rst b/docs/source/developer_guide/extending_lmcache/native_connectors.rst
index c8d3974f59..ce7f6b5724 100644
--- a/docs/source/developer_guide/extending_lmcache/native_connectors.rst
+++ b/docs/source/developer_guide/extending_lmcache/native_connectors.rst
@@ -50,7 +50,8 @@ Step 1: C++ Connector
 ---------------------
 
 Create your connector directory (e.g., ``csrc/storage_backends/mybackend/``) and
-inherit from ``ConnectorBase<YourConnectionType>``. You only need to override 4 methods.
+inherit from ``ConnectorBase<YourConnectionType>``. You need to override 4 required methods
+(and optionally ``do_single_delete`` to support eviction).
 
 **connector.h:**
 
@@ -104,6 +105,12 @@ inherit from ``ConnectorBase<YourConnectionType>``. You only need to override 4
         // send EXISTS, return true/false
       }
 
+      // 5. DELETE: remove key (optional, has default no-op)
+      bool do_single_delete(MyConn& conn,
+                            const std::string& key) override {
+        // send DELETE, return true if deleted, false if not found
+      }
+
       // Optional: clean shutdown
       void shutdown_connections() override {
         // close sockets, free resources
@@ -136,8 +143,8 @@ inherit from ``ConnectorBase<YourConnectionType>``. You only need to override 4
 Step 2: Pybind Module
 ---------------------
 
-Use the ``LMCACHE_BIND_CONNECTOR_METHODS`` macro, which binds all 6 methods
-(``event_fd``, ``submit_batch_get/set/exists``, ``drain_completions``, ``close``)
+Use the ``LMCACHE_BIND_CONNECTOR_METHODS`` macro, which binds all 7 methods
+(``event_fd``, ``submit_batch_get/set/exists/delete``, ``drain_completions``, ``close``)
 with proper GIL release and Python buffer protocol handling.
 
 .. code-block:: cpp
@@ -255,10 +262,12 @@ Create a new file in the L2 adapters package:
 
     class MyBackendL2AdapterConfig(L2AdapterConfigBase):
         def __init__(self, host: str, port: int,
-                     num_workers: int = 8):
+                     num_workers: int = 8,
+                     max_capacity_gb: float = 0):
             self.host = host
             self.port = port
             self.num_workers = num_workers
+            self.max_capacity_gb = max_capacity_gb
 
         @classmethod
         def from_dict(cls, d: dict) -> "MyBackendL2AdapterConfig":
@@ -269,8 +278,10 @@ Create a new file in the L2 adapters package:
             if not isinstance(port, int) or port <= 0:
                 raise ValueError("port must be a positive integer")
             num_workers = d.get("num_workers", 8)
+            max_capacity_gb = d.get("max_capacity_gb", 0)
             return cls(host=host, port=port,
-                       num_workers=num_workers)
+                       num_workers=num_workers,
+                       max_capacity_gb=max_capacity_gb)
 
         @classmethod
         def help(cls) -> str:
@@ -296,7 +307,10 @@ Create a new file in the L2 adapters package:
         native_client = LMCacheMyBackendClient(
             config.host, config.port, config.num_workers
         )
-        return NativeConnectorL2Adapter(native_client)
+        return NativeConnectorL2Adapter(
+            native_client,
+            max_capacity_gb=config.max_capacity_gb,
+        )
 
 
     # Self-register -- runs automatically when the module
@@ -417,12 +431,18 @@ pybind ``LMCACHE_BIND_CONNECTOR_METHODS`` contract):
             self,
             keys: list[str],
         ) -> int: ...
+        def submit_batch_delete(
+            self,
+            keys: list[str],
+        ) -> int: ...
         def drain_completions(
             self,
         ) -> list[tuple[int, bool, str, list[bool] | None]]: ...
         def close(self) -> None: ...
 
-The factory validates these methods at creation time and raises ``TypeError`` if any are missing.
+The factory validates the first 6 methods at creation time and raises ``TypeError`` if
+any are missing. ``submit_batch_delete`` is **optional** -- if absent, the adapter's
+``delete()`` method will be a no-op (eviction will not remove keys from the backend).
 
 Configuration
 ~~~~~~~~~~~~~
@@ -459,6 +479,10 @@ Configuration
      - ``dict``
      - no
      - Forwarded as ``**kwargs`` to the connector class constructor.
+   * - ``max_capacity_gb``
+     - ``float``
+     - no
+     - Maximum L2 storage capacity in GB for client-side usage tracking. Required for L2 eviction. Default 0 (disabled).
 
 Loading Flow
 ~~~~~~~~~~~~
@@ -506,7 +530,7 @@ Step-by-Step: Building an External Native Connector Plugin
 
 2. **Implement the C++ connector** inheriting from ``ConnectorBase<T>`` and override
    the 4 required methods (``create_connection``, ``do_single_get``, ``do_single_set``,
-   ``do_single_exists``).
+   ``do_single_exists``) and optionally ``do_single_delete`` for eviction support.
 
 3. **Create pybind11 bindings** using the ``LMCACHE_BIND_CONNECTOR_METHODS`` macro:
 
@@ -583,7 +607,7 @@ Checklist
 
 Use this checklist when adding a new native connector:
 
-1. C++ connector inheriting ``ConnectorBase<T>`` with 4 method overrides
+1. C++ connector inheriting ``ConnectorBase<T>`` with 4 required + 1 optional (``do_single_delete``) method overrides
 2. Pybind module using ``LMCACHE_BIND_CONNECTOR_METHODS``
 3. ``setup.py`` entry for the new ``CppExtension``
 4. Python client inheriting ``ConnectorClientBase`` (non-MP mode)
@@ -594,7 +618,7 @@ Use this checklist when adding a new native connector:
 For **external** native connector plugins (``native_plugin``):
 
 1. Separate pip-installable package with C++ pybind11 extension
-2. Connector class exposing the 6 required methods
+2. Connector class exposing the 6 required methods (+ optional ``submit_batch_delete`` for eviction)
 3. Python factory class for backend selection
 4. ``pip install -e .`` and configure via ``--l2-adapter`` JSON
 5. Unit tests (see ``examples/lmc_external_native_connector/tests/``)
diff --git a/docs/source/kv_cache/storage_backends/resp.rst b/docs/source/kv_cache/storage_backends/resp.rst
index 9afb7b3c42..2647ab8f06 100644
--- a/docs/source/kv_cache/storage_backends/resp.rst
+++ b/docs/source/kv_cache/storage_backends/resp.rst
@@ -281,6 +281,45 @@ The ``--l2-adapter`` JSON accepts these fields:
      - str
      - ``""``
      - Redis AUTH password (leave empty for no auth)
+   * - ``max_capacity_gb``
+     - float
+     - 0
+     - Maximum L2 storage capacity in GB for client-side usage tracking. Required for L2 eviction. Set to 0 (default) to disable usage tracking.
+
+L2 Eviction
+~~~~~~~~~~~~
+
+To enable automatic eviction of least-recently-used keys when the Redis backend fills up,
+set ``max_capacity_gb`` and add an ``"eviction"`` block:
+
+.. code-block:: bash
+
+    lmcache server \
+        --l1-size-gb 10 \
+        --eviction-policy LRU \
+        --chunk-size 16 \
+        --l2-adapter '{
+            "type": "resp",
+            "host": "localhost",
+            "port": 6379,
+            "num_workers": 8,
+            "max_capacity_gb": 10,
+            "eviction": {
+                "eviction_policy": "LRU",
+                "trigger_watermark": 0.8,
+                "eviction_ratio": 0.2
+            }
+        }' \
+        --port 6555
+
+This configures a 10 GB capacity limit. When usage exceeds 80% (``trigger_watermark``),
+the eviction controller will delete the least-recently-used ~20% of stored keys
+(``eviction_ratio``) using the Redis ``DEL`` command.
+
+.. note::
+   ``max_capacity_gb`` enables **client-side** size tracking. It does not configure
+   the Redis server's ``maxmemory`` setting. You should set ``max_capacity_gb`` to
+   match or be slightly below your Redis server's available memory.
 
 
 Testing the Setup
diff --git a/examples/kv_cache_reuse/remote_backends/resp/README.md b/examples/kv_cache_reuse/remote_backends/resp/README.md
index 61df8cf49f..89532f1439 100644
--- a/examples/kv_cache_reuse/remote_backends/resp/README.md
+++ b/examples/kv_cache_reuse/remote_backends/resp/README.md
@@ -91,6 +91,7 @@ The `--l2-adapter` JSON accepts these fields:
 | `num_workers` | int | 8 | C++ worker threads for parallel I/O |
 | `username` | str | `""` | Redis ACL username |
 | `password` | str | `""` | Redis AUTH password |
+| `max_capacity_gb` | float | 0 | Max L2 capacity in GB for usage tracking (required for L2 eviction) |
 
 ### Launch vLLM with LMCache MP Connector
 
diff --git a/examples/lmc_external_native_connector/csrc/connector.cpp b/examples/lmc_external_native_connector/csrc/connector.cpp
index 86b3768925..bad1084e0b 100644
--- a/examples/lmc_external_native_connector/csrc/connector.cpp
+++ b/examples/lmc_external_native_connector/csrc/connector.cpp
@@ -172,6 +172,13 @@ bool ExampleFSConnector::do_single_exists(WorkerFSConn& conn,
   return std::filesystem::exists(path);
 }
 
+bool ExampleFSConnector::do_single_delete(WorkerFSConn& conn,
+                                          const std::string& key) {
+  auto path = conn.base_path / safe_filename(key);
+  std::error_code ec;
+  return std::filesystem::remove(path, ec);
+}
+
 // ---------------------------------------------------------------
 // ExampleMemoryConnector
 // ---------------------------------------------------------------
@@ -220,4 +227,10 @@ bool ExampleMemoryConnector::do_single_exists(WorkerMemConn& conn,
   return conn.store->data.count(key) > 0;
 }
 
+bool ExampleMemoryConnector::do_single_delete(WorkerMemConn& conn,
+                                              const std::string& key) {
+  std::lock_guard<std::mutex> lk(conn.store->mu);
+  return conn.store->data.erase(key) > 0;
+}
+
 }  // namespace example_connector
diff --git a/examples/lmc_external_native_connector/csrc/connector.h b/examples/lmc_external_native_connector/csrc/connector.h
index 1ed8d7d21e..75702eafea 100644
--- a/examples/lmc_external_native_connector/csrc/connector.h
+++ b/examples/lmc_external_native_connector/csrc/connector.h
@@ -33,6 +33,7 @@ class ExampleFSConnector
   void do_single_set(WorkerFSConn& conn, const std::string& key,
                      const void* buf, size_t len, size_t chunk_size) override;
   bool do_single_exists(WorkerFSConn& conn, const std::string& key) override;
+  bool do_single_delete(WorkerFSConn& conn, const std::string& key) override;
 
  private:
   static std::string safe_filename(const std::string& key);
@@ -71,6 +72,7 @@ class ExampleMemoryConnector
   void do_single_set(WorkerMemConn& conn, const std::string& key,
                      const void* buf, size_t len, size_t chunk_size) override;
   bool do_single_exists(WorkerMemConn& conn, const std::string& key) override;
+  bool do_single_delete(WorkerMemConn& conn, const std::string& key) override;
 
  private:
   std::shared_ptr<SharedMemoryStore> store_;
diff --git a/lmcache/v1/distributed/l2_adapters/fs_native_l2_adapter.py b/lmcache/v1/distributed/l2_adapters/fs_native_l2_adapter.py
index 4cd443099a..7047b889c8 100644
--- a/lmcache/v1/distributed/l2_adapters/fs_native_l2_adapter.py
+++ b/lmcache/v1/distributed/l2_adapters/fs_native_l2_adapter.py
@@ -54,12 +54,14 @@ def __init__(
         relative_tmp_dir: str = "",
         use_odirect: bool = False,
         read_ahead_size: Optional[int] = None,
+        max_capacity_gb: float = 0,
     ):
         self.base_path = base_path
         self.num_workers = num_workers
         self.relative_tmp_dir = relative_tmp_dir
         self.use_odirect = use_odirect
         self.read_ahead_size = read_ahead_size
+        self.max_capacity_gb = max_capacity_gb
 
     @classmethod
     def from_dict(cls, d: dict) -> "FSNativeL2AdapterConfig":
@@ -84,12 +86,17 @@ def from_dict(cls, d: dict) -> "FSNativeL2AdapterConfig":
             if not isinstance(read_ahead_size, int) or read_ahead_size <= 0:
                 raise ValueError("read_ahead_size must be a positive integer")
 
+        max_capacity_gb = d.get("max_capacity_gb", 0)
+        if not isinstance(max_capacity_gb, (int, float)) or max_capacity_gb < 0:
+            raise ValueError("max_capacity_gb must be a non-negative number")
+
         return cls(
             base_path=base_path,
             num_workers=num_workers,
             relative_tmp_dir=str(relative_tmp_dir),
             use_odirect=use_odirect,
             read_ahead_size=read_ahead_size,
+            max_capacity_gb=float(max_capacity_gb),
         )
 
     @classmethod
@@ -106,7 +113,10 @@ def help(cls) -> str:
             "via O_DIRECT (default false)\n"
             "- read_ahead_size (int): trigger fs "
             "readahead by reading this many bytes "
-            "first (optional)"
+            "first (optional)\n"
+            "- max_capacity_gb (float): max L2 capacity "
+            "in GB for usage tracking / eviction "
+            "(default 0 = disabled)"
         )
 
 
@@ -148,7 +158,9 @@ def _create_fs_native_l2_adapter(
         config.use_odirect,
         config.read_ahead_size,
     )
-    return NativeConnectorL2Adapter(native_client)
+    return NativeConnectorL2Adapter(
+        native_client, max_capacity_gb=config.max_capacity_gb
+    )
 
 
 register_l2_adapter_type("fs_native", FSNativeL2AdapterConfig)
diff --git a/lmcache/v1/distributed/l2_adapters/native_connector_l2_adapter.py b/lmcache/v1/distributed/l2_adapters/native_connector_l2_adapter.py
index 26d8c3f245..4f44cd8fd8 100644
--- a/lmcache/v1/distributed/l2_adapters/native_connector_l2_adapter.py
+++ b/lmcache/v1/distributed/l2_adapters/native_connector_l2_adapter.py
@@ -77,8 +77,10 @@ class NativeConnectorL2Adapter(L2AdapterInterface):
     _OP_STORE = "store"
     _OP_LOOKUP = "lookup"
     _OP_LOAD = "load"
+    _OP_DELETE = "delete"
 
-    def __init__(self, native_client):
+    def __init__(self, native_client, max_capacity_gb: float = 0):
+        super().__init__()
         self._client = native_client
         self._client_fd: int = int(native_client.event_fd())
 
@@ -105,6 +107,19 @@ def __init__(self, native_client):
         # Client-side lock tracking (refcount per key)
         self._locked_keys: dict[ObjectKey, int] = defaultdict(int)
 
+        # Delete capability detection
+        self._has_delete = callable(getattr(native_client, "submit_batch_delete", None))
+
+        # Pending delete events for synchronous delete() calls
+        self._pending_delete_events: dict[L2TaskId, threading.Event] = {}
+
+        # Client-side size tracking for get_usage()
+        self._max_capacity_bytes = int(max_capacity_gb * (1024**3))
+        self._current_size_bytes: int = 0
+        self._key_sizes: dict[ObjectKey, int] = {}
+        # Pending store sizes: native future_id -> (keys, per_key_sizes)
+        self._pending_store_sizes: dict[int, tuple[list[ObjectKey], list[int]]] = {}
+
         # Task ID counter
         self._next_task_id: L2TaskId = 0
 
@@ -144,6 +159,7 @@ def submit_store_task(
     ) -> L2TaskId:
         key_strings = [_object_key_to_string(k) for k in keys]
         memviews = [_obj_to_memoryview(obj) for obj in objects]
+        per_key_sizes = [obj.get_size() for obj in objects]
 
         # Register pending op BEFORE submit to avoid race
         # with demux thread. The native submit is
@@ -157,6 +173,7 @@ def submit_store_task(
                 len(keys),
                 None,
             )
+            self._pending_store_sizes[future_id] = (list(keys), per_key_sizes)
 
         return task_id
 
@@ -223,7 +240,7 @@ def submit_load_task(
                 self._OP_LOAD,
                 task_id,
                 len(keys),
-                None,
+                list(keys),
             )
 
         return task_id
@@ -237,12 +254,57 @@ def query_load_result(self, task_id: L2TaskId) -> Bitmap | None:
     # ---------------------------------------------------------------
 
     def delete(self, keys: list[ObjectKey]) -> None:
-        # Not implemented for the native connector adapter.
-        pass
+        """Delete a batch of keys from the remote backend.
+
+        Submits a batch delete to the native connector and blocks
+        until the demux thread signals completion (up to 30s timeout).
+        Fires ``_notify_keys_deleted`` on success so eviction policy
+        tracking stays in sync.
+
+        No-op if the connector does not expose ``submit_batch_delete``
+        or if the key list is empty.
+        """
+        if not keys or not self._has_delete:
+            return
+
+        key_strings = [_object_key_to_string(k) for k in keys]
+        done_event = threading.Event()
+
+        with self._lock:
+            task_id = self._get_next_task_id()
+            future_id = int(self._client.submit_batch_delete(key_strings))
+            self._pending_ops[future_id] = (
+                self._OP_DELETE,
+                task_id,
+                len(keys),
+                list(keys),
+            )
+            self._pending_delete_events[task_id] = done_event
+
+        # Block until demux thread signals completion
+        if not done_event.wait(timeout=30.0):
+            with self._lock:
+                self._pending_delete_events.pop(task_id, None)
+                # Note: _pending_ops entry may already be consumed
+                # by the demux thread; pop is safe either way.
+                for fid, entry in list(self._pending_ops.items()):
+                    if entry[1] == task_id:
+                        self._pending_ops.pop(fid, None)
+                        break
+            logger.warning(
+                "delete() timed out after 30s for %d keys",
+                len(keys),
+            )
+            return
+
+        self._notify_keys_deleted(keys)
 
     def get_usage(self) -> tuple[float, float]:
-        # Not implemented for the native connector adapter.
-        return (-1.0, -1.0)
+        if self._max_capacity_bytes <= 0:
+            return (-1.0, -1.0)
+        with self._lock:
+            usage = self._current_size_bytes / self._max_capacity_bytes
+            return (usage, usage)
 
     # ---------------------------------------------------------------
     # Cleanup
@@ -291,6 +353,11 @@ def _demux_loop(self) -> None:
             if not completions:
                 continue
 
+            # Collect listener notifications to fire after
+            # releasing the lock.
+            keys_stored: list[ObjectKey] = []
+            keys_accessed: list[ObjectKey] = []
+
             with self._lock:
                 for (
                     future_id,
@@ -316,6 +383,15 @@ def _demux_loop(self) -> None:
 
                     if op_type == self._OP_STORE:
                         self._completed_stores[task_id] = ok
+                        # Update size tracking on success
+                        store_info = self._pending_store_sizes.pop(fid, None)
+                        if ok and store_info is not None:
+                            store_keys, sizes = store_info
+                            for key, size in zip(store_keys, sizes, strict=False):
+                                if key not in self._key_sizes:
+                                    self._key_sizes[key] = size
+                                    self._current_size_bytes += size
+                            keys_stored.extend(store_keys)
                         os.eventfd_write(self._store_efd, 1)
 
                     elif op_type == self._OP_LOOKUP:
@@ -331,14 +407,38 @@ def _demux_loop(self) -> None:
 
                     elif op_type == self._OP_LOAD:
                         bitmap = Bitmap(num_keys)
+                        loaded_keys: list[ObjectKey] = []
                         if result_bools is not None:
                             for i, loaded in enumerate(result_bools):
                                 if loaded:
                                     bitmap.set(i)
+                                    if lookup_keys is not None:
+                                        loaded_keys.append(lookup_keys[i])
                         elif ok:
                             # Fallback for connectors that
                             # do not report per-key results
                             for i in range(num_keys):
                                 bitmap.set(i)
+                            if lookup_keys is not None:
+                                loaded_keys.extend(lookup_keys)
+                        keys_accessed.extend(loaded_keys)
                         self._completed_loads[task_id] = bitmap
                         os.eventfd_write(self._load_efd, 1)
+
+                    elif op_type == self._OP_DELETE:
+                        # Decrement sizes for successfully deleted keys
+                        if result_bools is not None and lookup_keys is not None:
+                            for i, deleted in enumerate(result_bools):
+                                if deleted:
+                                    key = lookup_keys[i]
+                                    size = self._key_sizes.pop(key, 0)
+                                    self._current_size_bytes -= size
+                        evt = self._pending_delete_events.pop(task_id, None)
+                        if evt is not None:
+                            evt.set()
+
+            # Fire listener notifications outside the lock
+            if keys_stored:
+                self._notify_keys_stored(keys_stored)
+            if keys_accessed:
+                self._notify_keys_accessed(keys_accessed)
diff --git a/lmcache/v1/distributed/l2_adapters/native_plugin_l2_adapter.py b/lmcache/v1/distributed/l2_adapters/native_plugin_l2_adapter.py
index 688501373c..aba5f08c21 100644
--- a/lmcache/v1/distributed/l2_adapters/native_plugin_l2_adapter.py
+++ b/lmcache/v1/distributed/l2_adapters/native_plugin_l2_adapter.py
@@ -55,10 +55,12 @@ def __init__(
         module_path: str,
         class_name: str,
         adapter_params: dict[str, Any] | None = None,
+        max_capacity_gb: float = 0,
     ):
         self.module_path = module_path
         self.class_name = class_name
         self.adapter_params = adapter_params or {}
+        self.max_capacity_gb = max_capacity_gb
 
     @classmethod
     def from_dict(cls, d: dict) -> "NativePluginL2AdapterConfig":
@@ -74,10 +76,15 @@ def from_dict(cls, d: dict) -> "NativePluginL2AdapterConfig":
         if not isinstance(adapter_params, dict):
             raise ValueError("adapter_params must be a dict")
 
+        max_capacity_gb = d.get("max_capacity_gb", 0)
+        if not isinstance(max_capacity_gb, (int, float)) or max_capacity_gb < 0:
+            raise ValueError("max_capacity_gb must be a non-negative number")
+
         return cls(
             module_path=module_path,
             class_name=class_name,
             adapter_params=adapter_params,
+            max_capacity_gb=float(max_capacity_gb),
         )
 
     @classmethod
@@ -98,7 +105,10 @@ def help(cls) -> str:
             '"module_path": "my_ext.connector", '
             '"class_name": "MyConnectorClient", '
             '"adapter_params": '
-            '{"host": "localhost", "port": 1234}}'
+            '{"host": "localhost", "port": 1234}}\n'
+            "- max_capacity_gb (float): max L2 capacity "
+            "in GB for usage tracking / eviction "
+            "(default 0 = disabled)"
         )
 
 
@@ -166,13 +176,23 @@ def _create_native_plugin_l2_adapter(
             native_client.close()
         raise
 
+    if not callable(getattr(native_client, "submit_batch_delete", None)):
+        logger.warning(
+            "%s.%s does not expose submit_batch_delete; "
+            "L2 eviction delete will be a no-op.",
+            config.module_path,
+            config.class_name,
+        )
+
     logger.info(
         "Created native plugin L2 adapter: %s.%s (params=%s)",
         config.module_path,
         config.class_name,
         config.adapter_params,
     )
-    return NativeConnectorL2Adapter(native_client)
+    return NativeConnectorL2Adapter(
+        native_client, max_capacity_gb=config.max_capacity_gb
+    )
 
 
 register_l2_adapter_type("native_plugin", NativePluginL2AdapterConfig)
diff --git a/lmcache/v1/distributed/l2_adapters/resp_l2_adapter.py b/lmcache/v1/distributed/l2_adapters/resp_l2_adapter.py
index 5f9ee78dda..83a141a115 100644
--- a/lmcache/v1/distributed/l2_adapters/resp_l2_adapter.py
+++ b/lmcache/v1/distributed/l2_adapters/resp_l2_adapter.py
@@ -53,6 +53,7 @@ def __init__(
         num_workers: int = 8,
         username: str = "",
         password: str = "",
+        max_capacity_gb: float = 0,
     ):
         super().__init__()
         self.host = host
@@ -60,6 +61,7 @@ def __init__(
         self.num_workers = num_workers
         self.username = username
         self.password = password
+        self.max_capacity_gb = max_capacity_gb
 
     @classmethod
     def from_dict(cls, d: dict) -> "RESPL2AdapterConfig":
@@ -78,12 +80,17 @@ def from_dict(cls, d: dict) -> "RESPL2AdapterConfig":
         username = d.get("username", "")
         password = d.get("password", "")
 
+        max_capacity_gb = d.get("max_capacity_gb", 0)
+        if not isinstance(max_capacity_gb, (int, float)) or max_capacity_gb < 0:
+            raise ValueError("max_capacity_gb must be a non-negative number")
+
         return cls(
             host=host,
             port=port,
             num_workers=num_workers,
             username=str(username),
             password=str(password),
+            max_capacity_gb=float(max_capacity_gb),
         )
 
     @classmethod
@@ -98,7 +105,10 @@ def help(cls) -> str:
             "- username (str): auth username "
             "(default empty)\n"
             "- password (str): auth password "
-            "(default empty)"
+            "(default empty)\n"
+            "- max_capacity_gb (float): max L2 capacity "
+            "in GB for usage tracking / eviction "
+            "(default 0 = disabled)"
         )
 
 
@@ -139,7 +149,9 @@ def _create_resp_l2_adapter(
         config.port,
         config.num_workers,
     )
-    return NativeConnectorL2Adapter(native_client)
+    return NativeConnectorL2Adapter(
+        native_client, max_capacity_gb=config.max_capacity_gb
+    )
 
 
 # Self-register config type and adapter factory
diff --git a/tests/v1/distributed/test_native_connector_l2_adapter.py b/tests/v1/distributed/test_native_connector_l2_adapter.py
index 402c51e656..55d83c73ad 100644
--- a/tests/v1/distributed/test_native_connector_l2_adapter.py
+++ b/tests/v1/distributed/test_native_connector_l2_adapter.py
@@ -108,6 +108,22 @@ def submit_batch_exists(self, keys: list[str]) -> int:
 
         return fid
 
+    def submit_batch_delete(self, keys: list[str]) -> int:
+        with self._lock:
+            fid = self._next_id
+            self._next_id += 1
+
+        results = []
+        for key in keys:
+            if key in self._store:
+                del self._store[key]
+                results.append(True)
+            else:
+                results.append(False)
+        self._push_completion(fid, True, "", results)
+
+        return fid
+
     def drain_completions(self) -> list[tuple[int, bool, str, list[bool] | None]]:
         # Drain the eventfd
         try:
@@ -946,3 +962,214 @@ def test_type_name_lookup(self):
             base_path="/tmp/test",
         )
         assert get_type_name_for_config(cfg) == "fs_native"
+
+
+# =============================================================================
+# Delete Interface Tests
+# =============================================================================
+
+
+class TestDeleteInterface:
+    def test_delete_existing_key(self, adapter):
+        key = create_object_key(1)
+        obj = create_memory_obj()
+        store_fd = adapter.get_store_event_fd()
+        lookup_fd = adapter.get_lookup_and_lock_event_fd()
+
+        # Store
+        adapter.submit_store_task([key], [obj])
+        wait_for_event_fd(store_fd, timeout=5.0)
+        adapter.pop_completed_store_tasks()
+
+        # Verify exists
+        task_id = adapter.submit_lookup_and_lock_task([key])
+        wait_for_event_fd(lookup_fd, timeout=5.0)
+        bitmap = adapter.query_lookup_and_lock_result(task_id)
+        assert bitmap.test(0) is True
+        adapter.submit_unlock([key])
+
+        # Delete (synchronous)
+        adapter.delete([key])
+
+        # Verify gone
+        task_id = adapter.submit_lookup_and_lock_task([key])
+        wait_for_event_fd(lookup_fd, timeout=5.0)
+        bitmap = adapter.query_lookup_and_lock_result(task_id)
+        assert bitmap.test(0) is False
+
+    def test_delete_nonexistent_key(self, adapter):
+        key = create_object_key(999)
+        adapter.delete([key])  # should not raise
+
+    def test_delete_empty_keys(self, adapter):
+        adapter.delete([])  # should not raise
+
+    def test_delete_batch(self, adapter):
+        keys = [create_object_key(i) for i in range(5)]
+        objs = [create_memory_obj(fill_value=float(i)) for i in range(5)]
+        store_fd = adapter.get_store_event_fd()
+        lookup_fd = adapter.get_lookup_and_lock_event_fd()
+
+        # Store all
+        adapter.submit_store_task(keys, objs)
+        wait_for_event_fd(store_fd, timeout=5.0)
+        adapter.pop_completed_store_tasks()
+
+        # Delete first 3
+        adapter.delete(keys[:3])
+
+        # Verify: first 3 gone, last 2 remain
+        task_id = adapter.submit_lookup_and_lock_task(keys)
+        wait_for_event_fd(lookup_fd, timeout=5.0)
+        bitmap = adapter.query_lookup_and_lock_result(task_id)
+        for i in range(3):
+            assert bitmap.test(i) is False
+        for i in range(3, 5):
+            assert bitmap.test(i) is True
+        adapter.submit_unlock(keys[3:])
+
+
+# =============================================================================
+# Delete Backward Compatibility Tests
+# =============================================================================
+
+
+class TestDeleteBackwardCompatibility:
+    def test_delete_noop_without_submit_batch_delete(self):
+        """Connector without submit_batch_delete => delete is no-op."""
+
+        class NoDeleteConnector:
+            """Mock connector that only has the 6 original methods."""
+
+            def __init__(self):
+                self._efd = os.eventfd(0, os.EFD_NONBLOCK | os.EFD_CLOEXEC)
+                self._closed = False
+
+            def event_fd(self) -> int:
+                return self._efd
+
+            def submit_batch_get(self, keys, memoryviews):
+                return 0
+
+            def submit_batch_set(self, keys, memoryviews):
+                return 0
+
+            def submit_batch_exists(self, keys):
+                return 0
+
+            def drain_completions(self):
+                return []
+
+            def close(self):
+                if not self._closed:
+                    self._closed = True
+                    os.close(self._efd)
+
+        client = NoDeleteConnector()
+        adp = NativeConnectorL2Adapter(client)
+        try:
+            key = create_object_key(1)
+            adp.delete([key])  # should not raise, just no-op
+        finally:
+            adp.close()
+
+
+# =============================================================================
+# Usage Tracking Tests
+# =============================================================================
+
+
+@pytest.fixture
+def adapter_with_capacity():
+    """Adapter with max_capacity_gb set for usage tracking tests."""
+    mock_client = MockNativeConnector()
+    # 100 floats * 4 bytes = 400 bytes per obj; capacity = 2000 bytes = 2000/1024^3 GB
+    adp = NativeConnectorL2Adapter(mock_client, max_capacity_gb=2000 / (1024**3))
+    yield adp
+    adp.close()
+
+
+class TestUsageTracking:
+    def test_get_usage_without_capacity(self, adapter):
+        """Without max_capacity_bytes, get_usage returns (-1, -1)."""
+        usage = adapter.get_usage()
+        assert usage == (-1.0, -1.0)
+
+    def test_get_usage_starts_at_zero(self, adapter_with_capacity):
+        usage, _ = adapter_with_capacity.get_usage()
+        assert usage == 0.0
+
+    def test_get_usage_after_store(self, adapter_with_capacity):
+        adp = adapter_with_capacity
+        store_fd = adp.get_store_event_fd()
+
+        key = create_object_key(1)
+        obj = create_memory_obj(size=100, fill_value=1.0)  # 100 floats = 400 bytes
+
+        adp.submit_store_task([key], [obj])
+        wait_for_event_fd(store_fd, timeout=5.0)
+        adp.pop_completed_store_tasks()
+
+        usage, _ = adp.get_usage()
+        # 400 bytes / 2000 bytes = 0.2
+        assert usage == pytest.approx(0.2)
+
+    def test_get_usage_after_delete(self, adapter_with_capacity):
+        adp = adapter_with_capacity
+        store_fd = adp.get_store_event_fd()
+
+        key = create_object_key(1)
+        obj = create_memory_obj(size=100, fill_value=1.0)
+
+        # Store
+        adp.submit_store_task([key], [obj])
+        wait_for_event_fd(store_fd, timeout=5.0)
+        adp.pop_completed_store_tasks()
+
+        assert adp.get_usage()[0] == pytest.approx(0.2)
+
+        # Delete
+        adp.delete([key])
+
+        assert adp.get_usage()[0] == pytest.approx(0.0)
+
+    def test_get_usage_store_delete_cycle(self, adapter_with_capacity):
+        adp = adapter_with_capacity
+        store_fd = adp.get_store_event_fd()
+
+        # Store 3 objects (3 * 400 = 1200 bytes)
+        keys = [create_object_key(i) for i in range(3)]
+        objs = [create_memory_obj(size=100, fill_value=float(i)) for i in range(3)]
+
+        adp.submit_store_task(keys, objs)
+        wait_for_event_fd(store_fd, timeout=5.0)
+        adp.pop_completed_store_tasks()
+
+        usage, _ = adp.get_usage()
+        assert usage == pytest.approx(1200 / 2000)
+
+        # Delete 2
+        adp.delete(keys[:2])
+
+        usage, _ = adp.get_usage()
+        assert usage == pytest.approx(400 / 2000)
+
+    def test_idempotent_store_no_double_count(self, adapter_with_capacity):
+        adp = adapter_with_capacity
+        store_fd = adp.get_store_event_fd()
+
+        key = create_object_key(1)
+        obj = create_memory_obj(size=100, fill_value=1.0)
+
+        # Store same key twice
+        adp.submit_store_task([key], [obj])
+        wait_for_event_fd(store_fd, timeout=5.0)
+        adp.pop_completed_store_tasks()
+
+        adp.submit_store_task([key], [obj])
+        wait_for_event_fd(store_fd, timeout=5.0)
+        adp.pop_completed_store_tasks()
+
+        # Should only count once
+        usage, _ = adp.get_usage()
+        assert usage == pytest.approx(0.2)

From 550241961be6edae295cd0a374db1e46f96fe388 Mon Sep 17 00:00:00 2001
From: jooho <Jooho.lee@xcena.com>
Date: Fri, 3 Apr 2026 15:06:00 +0900
Subject: [PATCH 03/10] [Connector] Maru: zero-copy KV cache sharing via CXL
 shared memory  (#2705)

* feat: Add MaruBackend as a storage backend for CXL shared memory

Signed-off-by: jooho-xcena <jooho.lee@xcena.com>
Co-authored-by: youngrok-XCENA <yr.song@xcena.com>
Co-authored-by: hyunyul-XCENA <hyunyul.cho@xcena.com>
Co-authored-by: seohui-XCENA <seohui.son@xcena.com>
Co-authored-by: kihwan-XCENA <kihwan.kim@xcena.com>

* fix: capture store() return value and correct pin docstring

- _async_store now uses handler.store() return value instead of
  unconditionally setting success=True, preventing CXL memory leak
  on server-side rejection
- Fix batched_async_contains docstring to reflect actual batch_pin
  RPC support

Signed-off-by: youngrok-XCENA <yr.song@xcena.com>

* style: fix ruff-format in maru_backend.py

Signed-off-by: jooho-xcena <jooho.lee@xcena.com>

---------

Signed-off-by: jooho-xcena <jooho.lee@xcena.com>
Signed-off-by: youngrok-XCENA <yr.song@xcena.com>
Co-authored-by: youngrok-XCENA <yr.song@xcena.com>
Co-authored-by: hyunyul-XCENA <hyunyul.cho@xcena.com>
Co-authored-by: seohui-XCENA <seohui.son@xcena.com>
Co-authored-by: kihwan-XCENA <kihwan.kim@xcena.com>
Co-authored-by: Rocky Song <167060552+youngrok-XCENA@users.noreply.github.com>
---
 docs/source/assets/maru-kvcache.png           | Bin 0 -> 50599 bytes
 .../kv_cache/storage_backends/index.rst       |   1 +
 .../source/kv_cache/storage_backends/maru.rst | 113 +++
 lmcache/v1/config.py                          |   7 +
 lmcache/v1/storage_backend/__init__.py        |  14 +
 lmcache/v1/storage_backend/maru_backend.py    | 734 ++++++++++++++++
 lmcache/v1/storage_backend/storage_manager.py |   9 +-
 tests/v1/storage_backend/test_maru_backend.py | 788 ++++++++++++++++++
 8 files changed, 1664 insertions(+), 2 deletions(-)
 create mode 100644 docs/source/assets/maru-kvcache.png
 create mode 100644 docs/source/kv_cache/storage_backends/maru.rst
 create mode 100644 lmcache/v1/storage_backend/maru_backend.py
 create mode 100644 tests/v1/storage_backend/test_maru_backend.py

diff --git a/docs/source/assets/maru-kvcache.png b/docs/source/assets/maru-kvcache.png
new file mode 100644
index 0000000000000000000000000000000000000000..137261221d7cb22e64f4735fefe73d1e1b78b3e8
GIT binary patch
literal 50599
zcmeFa1z6Q-+CL76dN4VJ2#Ua=1f;v`5YnB}-AFg0C?z6FN=Zp~HyDV7NH-|mNK5~p
zL#R75@9w<2GdsKg--}$#InVd$yFPb(ukn+S61jK|?;H{m(#6}Na5*F-lr$tH<UYt5
z(2_i#5QT)qiEAgMVrSuGXku=FM9L_5^of*#&e+P<j+7Bj%D|wbN270}<49v-1-^hM
zIz|ST$B!hfTujW(bx0Y6nQ7?2qnpYmmiktXw&0_b0{BBu2bviLz$fs4h3V*{6AKds
zXyLcEHaAc<&=ohaLyTu+rD0?N%{RqG6(l7{83e&+a}zTI@E;KaJu@rB5J6)bD+|yf
zOwR<?L;M4c@;Zh(HYPt!f!L$1o{qV}(e~+&cCBk=qi<ky)WitJF_1C}k<#&lzKCB&
zL46Y)BO4tH@WoOGtZ{g93mqGKEnOWwGXqO~EprP!9X(^PI%0kk{i7a2%4Vk4EQ~^y
zN_JK{4E6%f=4N1uzn%MJ1q&w;8y#z7Nh^H=b1;Rz)6o<xY)nUU>N_7b(9^Sni$JVm
zWOK64@gWcm@+K}PCp$a_=w@%CZ(w^o_-Le^m6f@jiS^$$>RDM@8t5I9?s!HW8yf_@
z4v%}>WN2l6e7fTXYe4b8>49jF|J4m6T9r-o?TnB5vN5n8?FG>;YG7hye6lh<3;WR%
z3!RhB$0xBh)&cBuH2zmKI=aV`+qAK=0`vVu!k-_Xbh2;~G%!b8_Q^dmiK+@385+<@
zis(362s1lM!Oaw?j~53l^aoA&{oZW8OUl1zVaAgi{|5^nZ_w7x`9w-=tn4lI4G?sv
z2U6;2Y+`31Z>^(;pt~dBTF_=}XJLN)7$^&KK`V2sBXMFhWJdf0U2N@atjr94dctz}
z1D-e-*w~o>j^Q^qF|q`+*jXW_G_<m`lRw@AV%fv*N9;|HP!_ge2PT$A3W&~d!~!}t
zddKXKc#P=&(_)N=KcM~S5*&2Q?T^`3-dM*5oQ;7_LQ?QZhUsow+S=(@>H)Dilr+Tt
z42}iz@N)h>XZ_$W5d)x+>};ID<i<boIKz>OVW4yTArLHxQ3$a<UWbk4`1`TkpA6AC
z7DuD+QzHib9_|EvjyeACZy%xNe~(}si>WoZy%UZ9n|%B)veQ3i4xpg_K64=0;a6n;
zPHn{f{m~Srr#lw5pD0X!LeUcnvoRlS>X^c;#~SfJhr;y7Ecj2580czignStrIO!N!
z0ihPKHn1@P!f<G1k6UF<nt)0C-)a>@Lk2xPFzi=aMW02Ng_#9B`IWvn(j9a(^ay3~
zD}Im!=A4v)#T?iT0bLvL$q4aD;K;ro_x^+R0Q2$v{>&u5Py_6Af6FBF^v8_#AH*g9
zCcE<gTSY)m$9}9MPc*?X&HsaFe2hZ>PZRuQnt&es{EfZ%{{26QO^#g?1N~q51iup`
zSlQbg!b)(`-v$%MD)T3B3fwP#gr5Sejjp+so*B^Eph*~@P|$(^j=wSyEQ~BHhCiO1
zxFz&72*Y6DWMZcRM$&!%rg}UN;t3pKyb*xo@C!m-5nljWw6Xi;CJq~a+Qt#_Ku;qB
zU|A5p^KYN<Q275oMEgyIX=7lnV`t*<x6asa@y73&`(y=hC>;cRJ(<Va%EZ#{5ElRb
zSx)A%aFRic{(*7XS^n0zF)*+lUD7{>vqy8D%nbS;ZS?nSiV*}4022O=&Hw(G<KBmW
z_#gHBeYlza80Y<oLUOFF|2!f2?_ziaoBU(%{g5mEKsujzY=0u1kHzP|gU$?x4&&dK
zp%a1rNjw?oez#)#i|BlefB!r>AKe^?TmFd1{Lx0w5=1F}vU-TG2(x!+=@4Ij*uBGV
zziId^tt^4@IWmUFb`LTBciKJ1L#6d+vd8b4`v(L5!dB6Lci$0bM;LFWV<>WB8jmdd
z@vz?)lsQ@LuQf<VH_t%#Pk{S>B`~PZY`~_E2+jNopRqCM0)z&h{9~8zp9l;d@#9Yc
zKtUCdQJ|9nLGj~9f3Ta+{%be?A4dC_0Rtg;=!Cic`fwlPv9b9#bIJc4K4w4s0bKIS
zK+mrTEN5V30%A}MbjO7FqoaK%SMzfm=fwIS2m9DT(CLt%$J&FD{TQSD2NC$#dHZiB
z@Ue&d7Z4Z(asKlu{5|LPJH7EAc;jDD^na)bAM3@xg2D`}|M?U?PRjgwSo9<(@GoIe
z17=18#v`nV$O)bVU=V2leH~ll@0mu#7a1KpkTgJ~1wn9t4uKayy6FV0(ldQ;K)_XM
zko2cxJ?Zj4VAjLo-%}4KAoqLJhY?WuD7=H15rHrMJ#n8C6!sG^L0F9616mOoyYJzQ
z|AoKwd*(iYsQ+^y==XSCN3)#F_3J>;36?&#j^DBNiFLF+j0^q~*!q85l8yBk3>+`X
z#C#lkI$83+7S1#M^Z6K%<p!b2zX4Q?$KQWSrGJ;+L*VsOhF<45f3F8b43X#ib&?IP
zV+ZPi=w!@wfUC#=00*O!4(NB&!U9wgfT|Z08$=0;AOk5spw9QlM*v+8cuC5j&<6pF
z|7i998<{w^WBxb>aP*Aq$M<^7FyF1g3B&wbA^KefdKYmf9d;%G5la^-6-7rUU4fHQ
zl|LK6Auj*#mun#0{$HZ<zbV&1XzgFY^uIhKPtS1TsvXn#FHOn+CW(&$?mt1||I5e&
zfj<2Gg}MB>GUqq+06k(5Lg#!}1Sb&a#8~~MDf!>zl4FqkhoHdUT;P}u|0NLkhiBow
z<HAGG_C17ol*jwMLCljB;{Rpuj-};?%=|JU%J>Ti_3ugF{hj^%GC_V~!cQ#pACDsG
z8BU72PEY{?wIH;`$(sKSF!DD={Ey6P{N@6Ggbw)*MUP_0|651$yVJ+Q@J~8@dgeN|
zwkAh~XrKn*SLy!$7ri-pM%H5kbYdY-6vc^9{0V}{_={>v#uHP1vgUuSApY}V+27~R
z(SaXfkRCrm?EfowP7u^s+aS^=zv0mt*y-p4Z|_fX*iI@%ehRstX!{eK#&GiL#0eL&
z{X#YWTOBq=X=z6%Cvi4KrrUOwa1|DDBSG^MhwTr+X}?`e^hZ>J{N+ma?_;w6Csi!{
z3AdjxH}fy5$NvNsOMfCj$7}vqs@UHalfNdnsjp+eX84;$>@0e02D*kPI{BxUUVa&J
z`&AI-sEnOX-oOTgX^x-%!TIcyVC_%3_j_vfMETOO9>cq1USXj7MR@h!s(gQw=qFV*
z|3ob1U&)630Yv}Dan@rlkTW<^1HeE_>R5s|?f#7%aS}@V&Jh4&A9_Y79Km)B5>Eiy
zpTQA_)tmpr%YY|!pg&%_{5c<T`1Itp&!Y#&0}R2-ut#Z`$}KW6BqVgC+i-pbC*=8<
zv(eYO){BF>Ei|lId$DlTZeHqL(}mz;nqs7z5D>+agm{PXL8wVkA-glwR|WjiZbPab
zA-!VlKx?@wZ$4--*gZES-RhK+*(IhH8q74Y-m1)KJICHy)n4gpD4cHA%?m|G{_zXB
z>c!D<+!TkF%6a(2%LYv}DNI~uL5L3(e)8)^{z*7#o98|U)=$IHy<nj06*P%1MAw(7
zD5fwJ7$FKwh6LHK6Xumx4)MKr^2;}YR!A#HW%WS#=MA8HDWQ_csek$8h3Kc?b59t0
zIDdmQAB>roAk_c+_<NAfdwgiHqBBaSqCXCR?xg~KDjL{j*Q5$X_o~Hss)Jac5G4yD
znpFHc{?yMs3DLg_CY`Cf+;`aHs2>cS2n8bz`a+@%>>QmGWkm>a<WWhm`tU04(vKS;
ze2Pj5lRGt&_88-*3xHe%2mK@wdI1|5>dTH?MvGWG4@MY_moXDoaJ&Rq4*e2J7c}jQ
zHWAg28Tn9A1i&(cm_&?-TYjm6l72W`mJAG^=nJ*_X}BB;Ge#OwGHJoj!_&d=BFYG6
z-@~i(y7vfiv0f0weSFey#Qt$~-*a9seLGXXh7kOik`RRl{i*0WazgpxC~b_Viin5k
zn&3LV#Bi$891`;Irh-Y)Rf6$UM{Oj2umk+12I#l|lRJ%A#`gj;`yu7yiO`LM%bk`-
zKivz7|FIZ4847=osuxBYqhWKd4}nK7P1!gG=hpc1g}0c}g^58tE~@QH*9*`5{LfAO
z6nV7u{gjeV8q>6PDo^1K+VI)E%@M1bgS{n-{z8-D4k^w)RihY#a7~xAy^({xxMx?5
zFCzXa7+;)bRGPY)<>i!vymqDBY<q1c_L5-GX`$5aJ4rNmN<U?n&r(KlIp@c?Z}b(9
zc<l74nPnNoaM+(aN8CsB)5%Hh4GTCfR4i2^hQ~L3GAeQ?orKxX_vUryXz_B6`VyNz
z#8$d_-zWWNM*Sv)g#YM<V0e7%?rce?hbg5T8U;B9+JNg)m3WcX!jVkvlDw=2pLC^>
zG{Qtl=Dp6|NTmpP;iq8v(S5B=B=D<^B$~1H4;mr_<&#km*NSg^j~ceZ@=HV5`b4-^
zaSQ9nV5|79;@em8NAn{75|*QuuGLJ0spGk1DQR{~Bzb(TJIkW`)>myS>+TT?orAp;
z0|dHDn)~I^HAJ`l9?)%Xy@$na`qPhYM{};AUuDn-3$G}o8Out-DQm3hJok6~JzErn
zKBU?H*rYEVa&_#vDkUl$Gnib3-HdKaOH0v;>e$icgh=sGgT-~>FT-52$Y9LEwp7YL
z^RpNsI&H8T3L*263OG^|sXRc!W*K{Y54n>9#YPyxgp~Y%^)VE>QckoBP!oKrsJb+A
zO}Z)dFmy_k0;ASqz*zmoLk{Y+dD5}Aqy1(%>nkH}tCHc0&#A}s#vWYeiLl?@n73P)
zA?^^_CW(Xd&YVgLmyPXXsj{Tlc`Q=Xt1PzD%<@sQW;^kq?*p^VV%Zd)`jb$^oxBVK
zYRl}lmR<l~DCCw}VFOLg?uwFDV>1rZ!6a*qUm;;6vzbyO@72ov?KxFHVnW*T=>#Q%
zuk5p_iSw(iyjGzEU8lS$=IX+i;EyRuwn%}}R0I;G_%5ps{*ndtl|-cOQq^YcLh0C(
zjc;Q?u72*`y>I<6)p3igzX%Y&5bmU9d@-Hi7!sW7^DXhz+rj;vC99NJm-O(PDLkV-
z9&BVpkhCQ^7xs0-kI^&!jl-jxfQ#qW-|$?hd{Br33w9j5>yuTnSnhDJw>ePI$`dsz
z7$tJUnMCoL=hwPqyMr{iR`z4+_v0xkZf^L3{m-t_R#{ZLm$pwXRxGhhdbvBj?kRe6
zV@1PeL;kE+qYL3eQIDpu#>&i_E+cWCy)uSItFnnJwCAMR9b^`tWr*NX6kI3xK(51j
z!KSF?mg9OMLSd2t(sr+=6GMGTyoRe>)#G^F=hISR^U34f+GpqH7Um0DH&FW;f{E3)
zb_YiGyE8<{?w>|}&ofHG*gw6UIG7x+<<Td4>g=V$x(8>YFnP11_tD9&6I*u>S3dT!
zPRJbehKM*}a2s4tNca8t;1WlwVh?TA+A~MDX8QLkOC;o%KHGl#;&V-R!I$_6VH2js
z)~-*hA9?I_mp$$E=SxreCPxF<I2Q^#E?i3!(XDLW7@rbX*05JhzwGonYJ1JI?lewr
zlvwi!5W#2;sSy)nV`EJBl-=^VY({VL9g_O1oDR1tG<CU*7}xV#YB19?Pr0q(k!gL!
zzh?42Iyom$KW{3WYD(ockk@|H*@T7IN=#(vJ)}{yx4zJMyaYn^&PFPUYQj-pvSF9G
ztVf@AHwLUO*4>LB9U(=9=a);yaz#o~wmm9_uZ7WQ%ns?^`<8$&d*|)gsmolS(eP0(
z382x>Bt$%po6US2gROk0?Q3LHPjApwgJ?i1&MvC0ZzB7-I&b8*<}cuLbV{*LU`c<n
zjc)bauJf3!JFV4c(_Ct<@tU_$2bHQmg&V2`$6L6W!aJ`kUS>8j+`TT%+iAa7AZ;`8
zn4e>#SC9Ly$CrmVE^Yd(lao<avD<==Tr3yScYH;+ZT#|51xLo+*SnO>&3C^o5APD#
zec~S`fPWJ>z$BB%O_NW-^W?LZ;8~dQVdm$|c`z>S!fu~kv+puDwDKOFuW|sC1WW>$
z%Gb}Sdf<dHNV=$b(<|t3AAE-h93l{GD(Tfd&k~DHxIK%XRD~WqmQN-7x^TX8aeFRj
z$xodjTIKF*r*I92<%B}1>CzSM&B2aqK`fST8%>fKS;a5NpP>sv5<`_W`^p^_`d_IV
zNk`qkh1<6)0*5_<DoD+9$e!O^vyAqvdM-c}lY_ZqJrM*+D21?WCm*cwtSnUQ=bduB
zqk&3qE12|r|2CXK!?~I|Sen%_a{cOqyaq=-a7R34Zf?T*&%RCYyS)){dw0Xlabfm(
z+kPPHaBmc^vQ$Xb)hlbsB*)fwp*hB1h)@g_T<T@ogoy;*Z(+DI#I)+87&HR+U77rz
zVXQYQ<vis=Wq6(Yw0xoym&dJ?=;LDf9E~0qT)JE|OZprUEW2->|FMl{Rsi1ij3+&h
zPDw$0ghQnLa;Q3&uNv$Y#Z-{bo!6J?MR7f!&KD0@rtR37D9?;1)L2%PL#SmP_j7eE
zDJ>ps;~+y*xq+1Sw|d<|_wvWIMhWn}`hZBqS1M1-*haTo=-nMGCaoPsCDnISWcQnr
z``6$}ZJ`xS2M}U-NKb<g4$Kiw#k>1eaLGfMRnw*CW89i6b>0IXuhNn$^dIl?9DKPQ
z5|;Y1LLu;}z-OX0<2W9}V)umVaYjuJ@_oY3-KQFNMd^s1&Fss3(P4nQ7><m~3a??u
z2VI8qFwRYII`Gh^6q48J0UgHbeX|+8IV5H0am1svxhP|%iA>`8(Qb(Ht1Ms|>;Oy^
zcC?&`gd{<%*{{$)^+@Z{P_u_oE0)FJ_d{h#&-F+t+K$PEv(OMJpx^3!%bo7a3AfD_
zZ|tkT>rl$m2dnRxgEf@WhH}-vzOm7Pxi!P`DX8Go-TG4sGxt9P21sWUH0H(Wt;{^|
zCAjbJ)=1G5ey6i%U7CPo(?_Vf_+d!hqy0NJJRH#3ZEM@*X2w=0RXA;006~az<mu|i
zc+8CztzGN<yz^EydmHstb@1Yu=hZP9=6Rvh^dr}6^Tcxvq_h=ZqNS4oCea0U;+<6N
zYyckwjj((00sYJ*W)X2hWNf%uoOm{bqY-+Jb<q03W~kEOoZm}AUPgm!;XLTN5LS$x
z@wPCJAkIZL2X}EP@1U#nF#8cRm#JR9@h3MmTzFW%jD3n1teW50^&#e}YNV!JyY11W
zGkkH34LV5)iybOCUs@?w(i?0-!1J2mOf&Z8nTq|L^*JMmh2!IcLJ=n%ybnpO&GzAo
znBl8B<MrB2^u>l|;#)H*ahAEdT1R@0L@trLW<?5B4wY@jHZr{F6%EmuJEt9QcTJRS
zL)gf5@3_+N=M;S8814YH#`(fmow2l?{FuX1V&g-Tl9Ve=usja(*ldzjOibqoiC!sK
zoJ*nEQUnJ{ePWFGLSN(zuX}0U9fGynJZP>BDVN^UX+O5pd_uG?I%80HTY60rzekH`
zPacq&p2wloLnAJvKw38revr+*RhY=_=e{jUI~4)PwV!?vGK1+JyoB+-kl3I&`I4T@
zD};EugPU)Q({sN010u!~69%hogrxoKX&~1CcH5Rz*z-H|UP7e#xPf!?HufIebUyqZ
z(oa6oSKy{>^ODcX{*0_8z$ykP3P-rg%M|_7RRmB2>)@5(hS&Urs!<StA%f)MPly#J
za~+85s8d?;Au{5lgEX82PJu5ba0<SmHgW&JY7k=3QLXt!{m%|vgE&yLv^TJi0Gs#2
zd-LF_?-kI~xFx0X2QKpx1<u38w@i(Y9}}W`*@6AcFcltpF)(y|lodEIZJhup339tL
zX#O~2!fmih#42UR5xPYDCF};>^tktI4!e!Q`KrMdy#2t9MHq?~`}08{Ow7!Ya+SE=
z+L4WLa3XZX2I@$35}rX&18bWj85fp34=V6o=ktoYl+^nuGct9DDjZ8Rt6V7FMI+DM
zTdytGcF&bkq2*V9lP>}m>;(%x;O5PjLPZhLe(jCs08sY;u!r-@?+G?hXMt`uj&t9L
zWM*X@XipXo)%|$SzSc!sgHS=0JQJt;;v6|&KzaJB>2ree^Evqn_H{zqbbg)VBp+kB
zIkBPrz+hW+DJmCXE2-24oP$DTW^brp$voA4YVNg=w+ihC1I&s8@vvKYBfFEV#jQL$
zy}(vk38|SjoWueUo|5Zg*?Y{)DD!;3^_dQG2Z?cOOO(vB-KSrN*uQqs8Orrg5y?y$
z%zC3C&>1mJABXE}m(Un3Viy{(47QYeN#%0p`R=oG-s>2P*jns!dem|wE_2jNs1^OD
z8GU*|+=l9wWywR<Z!T_pAdkCB@DhFsCF&WJs;_%qXp!=R*Wqz<c~ro0r7APy8mpKe
zbgf2NRhuLV2j)L|bY^F*Lwcd4W-n`fzK>BwxbX!argl}Xr3!B*aX021<tJerlR;Ds
zgHMVf4%rFT)$NLpUXQ5cVWr)9!UZsuc`Ns3;g>f)uF!bk7WF(~pS(I?*CCl@HBzml
zj3dtUFef^qQy)L~h6+yR<!&@65x8<6`?oIs3{Q+=o$DQj?3Fq9zl|+`d)v%rfcI%_
zDXF5|iP6T-i&at1%xQe0a%U;Ib23OZ;SJo+@5(AJ|5^mEp&uEhB2BVZkslc{AjSRl
zIu4zaEz2`;(++3!Qqb?WPqbU;=_TSob@|s8hbo+GOrh#12%3XUK<E7Iv4sfX<p7KE
zRsaucJ~i=)e?q`YnlP%0bS70d&RnLjVF>rFVoYo@j%Fj2Hr<4J1INrux`OxCUzh9b
z<vs!3GJ263#*8!Jvy2~nKTWqKR{4Ii@6nhVy7t^hvcX^9vIx!E6L-$n7k$ouUD4ti
zCHoD}7EJEywRZ6Za^9`mq&{*Z^rW@ry6$-&RjhR0)VjtR)5Rgfef%(dTF&-eyN;4c
zaJbWV+vlFx7v+(#z(PfPkk4M%W*xG7zPCHYn{&}35brihCV4mZT!8%*Z1PsFRf(k!
z?l4W+<=Y;pK}d4}KB6jCbp;=rZLSI>1>B@-({^i+mF$DbFd+l#`mev^pela=VfK9}
zIuXmiFIO}EOx%3LeKYXW+K14W=-L{2)hb4rB`<pw)A4;5fS=K{zY<;((*LmEkFO3D
zJYwzEs0%bz2~MS5vQMamKQJ@)fAr)g^5K5!T>?_07Rs^D2fJ*~q_{$fV44dUep08M
z<qS|VX<-7HC6t#JcC33eU9)2B+HbpvHah0d(p^KQvCSV=aqMe+5GK+YzR3a2dD%zi
zngA~T9fw|((EE&0F273A3A6i)m8((}UtgaOAWrOu$)F&2<IV-zD+{dhF@53O`T7N?
z=9>`Vd@yvGu+~LyC~yD%{IWM1=Hpb_wh_Vsih%_Fd-nA%=bIGI)TD`MCTZHXFgwhq
zrOXmh)F?mMZW6oalcr*oS&@k?@N}zzILJw>w-qymh)$VI*c)jsFz2(*-swKlgethZ
z-~O3CslF>0Q8F33ug%fm-N2p_N)n>1xxi#O$hLHTC*Tc6OaDqb2kN&)&Tjm<91h}b
z&c<)cV-_hf4l5<{>traW(Y3+;&ZVk7r-VEEZD6ct`61&mg`tA=IlHw6k>F}cJZql>
zHxdc<8eBFP@k^XTYnVxnPGxE={6Ww*<8}Qtt2;KX%vfG>Xt|3jp2@{IcAN>7a96+W
zSAoeI&{RN^YjaQ5mD{{fdY!@cJcC!mosr6#l6)}{i@%<pOuGHtJdn8?k~ouPu9>Ut
zwMk`DHu>evWnLz@Y~DntGzmtS=q>Szh2p5q4EwAzw9B6X;#@Va-@vGV*fWBY(WXk#
zZB~{%FpZn{r$I(El;1Giywwg{Unm*bkP_(AP|il<e+MD-Q1QgR_VPZyZ4?UcfN~uX
zO2_&=<WuwM8QBb|X63TG5?^vW_sm?!0$JM&76xrwi+J~!gIL_R?aVAKH`*iU^~`}A
zVA3Iy@rdK5FB0NZG81?Tu*N3WiZg;{4H1VY8hu364hyYm*lOaMe=er*a7nCbT^Wm9
z<%;#;VZwwSVEB1cz{W?!biny{=khqXnVFeYH8hfVuk_y=w5(W|?^4#X2tBAfOVIn2
zNYH$3x-HFZm=@uB4teY>fXGpe!hXEZ4O7>JqVUbPB~9>VGK{7X_3IT3#c&BsKZA)%
zN9W7WrC%@_J;8S#4^9)Mw*TPhHwK5fsw<N>4-n??4tG?R42)e{vx$+v&m(BDfMC=9
zFgPc9yAd(Zd>JoYzkF#kr;vBpT}UGpI42I4tG<XO${U}{CBWD;v)!#wljdFzSuXHi
zjG%T_H_sEI@)F~j0S-3{#tx+2s(Pz_vNg^Mt{&&Q$j&(xZF?bDoL&7!rfpkq6K&0)
zZ$Cy=a`agekF6%HSN)m}eFl^8TPW*WQ*qMkF@0ehVxh!*A>qbW6T%RwR*n=@Bbr=q
z`}f;=yiyeHFlI~H_!VLSf5_JQBst#O?bQt4b$ND_y`9aH8{96vI9hIBF5Xvx>t~k?
zyA0FQLR3Ip#ohkWD%smvpd^ik%I#NY5s?d)a#EN$FI=}ws8&c%BoNPl3;oNJEeGE~
zmj0Vv4)3s)*DPskvk}ookM#_#<n31rS8jiisP5sT#U`%ZiQKe*cLt*Ue!wCn;{yMS
zu+l8vUJ<pVQSInwFoC--EVgFJy?|rSW&a^geDA@Tiwtkg*!9rYB}gzdd4qViQ+v8z
zKRj>Io^+eVyq9jNG$P!j<5iysfxEu%FkH89Vjm9Eftv)(h}fI)5he-FMq{-51w8FL
z3^hxo`$L3`1t!G0AcVW6kEIHqHEnY)mg;5X`T4`{lu^G_<PSSVE;U5zPBT{_Y8o~x
zWN;Vl3be%nb;fT;H(*vYROlrV3P%bS(rrabF%Sq#aLO1dYlRZEB0IKEoDzo;UG~$2
z3EvZ6@cm>I=iXhK8D!jI2mR9cKpxW9%rH#MHRwwyG;c#-x=re)Tw~UgJ$y<PlU&M9
z^|Tc<)eru<Vol4MSP{#M0c|>3j*O3)HUQu-)o=HEBA!!`-<C@9hn%+Z(3iDFBNXu5
z9V57=i{19ZB(36L^{L<`ll7`pNaveNoXrj7qhg%o0%d2{9cy-C%6J!VrreNK8cyt-
zh`$NTGH3r7n(ODPx^?bWPZ;$`W8E8-vVIC)U)0xn&p%RpiOjgEMj4Ekr#b<zzpVs~
z_m#{Xq=>9#88Cmo&5;6bxGK62j!&-l7N*PGqs@i&P-Z+`0G5|Yi%JevfZu|JoQ-mV
z@dk^kY%UH}X;qEs+}t-#(wa@)tSbfZ;Z+v!FtDa1?{rV`Q?T-=!|B{7Em8%bH-qne
zq#(U7&!~mK<@f1TVyvHKDZoXc@!Bm#nI9yP>Kf!XW;QL$-QoBNPuH8nG}&-%{bKXY
z-;W2Q`)3mr7sgW?kZikxFltrK(}d`p{MVOIX(p1Ic?KiK<#7hmL~7QS8b2fwY}->*
zJ+>i*evJYPdSEJgKE!w`N*$trG)n=)x_A328Up2i=Jk59mTD^|nQQh51~zmBIYUX&
zFCAUuZt(LpYFR88t3Ra6)PX4*0rkBDz)W9W<glqz1>;TiZN70_|H&=DCInsza_X$y
zF$ixYdRYvXFvLhxJN?6<AVl#(cp0S>XcheVT0ii5BRLq&Be;H;4FKIkNnZ{N5k5j7
zcD5NC)gK-2O95a%&4}f(Gk%!QIr4O{KsKewSl{$ycoEslWg)_CFg%g>{ff+w;Q}IH
zxSjkJj|UT85G--+w!v15cJZ2m%Qx8hK9HaJ>TQ;18^4X%uM9PCHM(F~cY*I9Mn*SL
zbuH6qM5lN$wIjq$7fHG_jElnbDiaC-`Y<qOQKP)r_<hJDn83c!+s|k{l+wwMGBCWX
zcq>~t92ZU9&je<+`z~KS6Knm@ii_*Xt8llCW!zL-|Bn>1cfJ4@D^?MP1E<4+iUs(F
z;^N*XzmvfgikE#3byCv(-K59r{fl?>-cvrlQbY9loEF>r)*WM~W+Q?)FOHPyXpBJY
zq5ktA%*jRR0)KnI;WYHI|0S$~k6+M~ztuOdi&hMjIz5qe-V~O8*=;|KVWMR=as3W7
z-P+PTLY|6|$<hz?Tk}{!P;0HZ#?2fil&{`YZsK$NS-T*`G>h}WVVg*f|LuKD0Zv85
zJ1EGduW>$-GATbt!XOmrbp7noo!FX-q=tk4{PTco^1AtK1uOi0+Eu65M)+~gZX54v
zhtew`%HLj>%|0-z#R5JamVe{IO_;*1fzdfCm;zS;VMzr0GQXJ`SI3zP!(<JH!u7?-
zg2j3DBukNTyjZw#3G==mDMI5kV&o}XOP@kX<j%({7~%_gH=?R&+X{J~L&g4Tdfv#>
ze8j^}WQF125^@QX+T=wwJ=dKL&#?>pZ7a82hC|$>{BHRByCm6)2`yjgEQ6c!M~LMl
z`O3`9i<zYP%20IP?|Ov!wU*hT_@l<onWkJ{^^P*LnsI_NoY!`V7fn-#I@puTJ5p@L
z?46CCkOjZE{r0^c3<Fpfl)_XgEGXqU<(HJw?w*-l<nK(DLaPaGR*dRi7@VuvxP7kc
z+SsT~>TV}{GD}CYt(ZkAV>+A?i!#Jl6x;$)sdKp^{O09oB%GGLN#`BQZEt-h>F_Nx
zcF9vcy={}yo=uZ(+|^-*#`CvOcX?Cvap9^Kkm>05Gq<}KNaU!z)u8d`yr^^44=>`W
z>BaLY&TSQ5Zya*r8t?C^U`sQ8=CxkOf83f&`oY<c{NZQk7Po0i!G%eosgVBMaM3Iz
zM<H)YB<92>flJs>N^d#3Sqb;0oNmX7z%19LI%Zbm`eydxfgtJJfkijA4C;kYBMYp2
ziOF~^8=hCwW@#w&w!rf0;yqJ#1|DHQBT?`y<6R+dw=-(Oj{cBP<Q#uVBe!kZg5>j=
z2d3&ucRM$HT&DAuS@z$dWl_?ols0%c4tH%#Kc_8h3>xL<olJBNmONOCleME|;!)g+
z#=xT~qEna(nUxP0U5_k-3GkevE&zxF(EiKhs!^p8BiTMDZhUY2Yhvt?J%>b=;&3h3
z62&*PWYWt|E)P25Sj}mo7x=|SMTo<7{YvGe;2Y1VtTq!0LgY6G&s)-AOe9_A-5wM^
zn0C@@x+~KzmSJVZNIq=UEH7j3AB7K&W>#-6mA2>x6m^3-l!!p*%79|*wm)RTOa4v5
z<SWwpiSbaSkv0zd8AU<y{L9?t(~TQLj^~^GBu%Tf>vvd2cSZ^{xm~TNN#Rp|DSPjD
zoE9|AVs~Ch9_&)k9;DALtrS;2uGo>?so{+q4-M+KK~;?xjj31@+eglOzFd2075iKw
zv3}A=in?ft82NNoT8uQFJhJwezE7Ql3Bf(9DL|JD8(lq%7ORx<G*5M(Pf8i8urKQJ
z$ucF_wMsA|2;Uy@*wh0CZM{lw^ZvBkUfF;}Op%X^>fZK7KJ|02+>n!401N)&LPfYF
zt7hw&9F|Y`k4y&&4$8X|d(v;mr{^T6Prf}p5&f*iNW*}xL-CP0)tdt@KLvsa3>_JG
z!`Y|U^8$boUsK1=^=a`~1WdX`KW<-85ty50?z2l=mkZw=O5P{RxY%fl6h6y3Jc+*a
z?1244)0QgLLnhngE=SRiJtFm$4?7>qL}uBFeN7PuBySFer(cf7hOQtdENK)j$Ux(Z
zB}{`m=nkl8Dc|>8@6z4XttZ)LH<-P!bPhRuoAqjSnEgV3vLcRDbausuYKJYM6sPdD
zR`$JACHn;HS~p4OC1JCO1ADANw8G1PvMw%i^)u1W1Z4B@{W=-iFjQsWsS>`5=Gne7
z*g8{JXQLbsOsOsnb(d%7+C0Il`>@zuG>rc0z<tqvOpZ6WOJWW^$92zIT{_xkhPQx=
z@_loUzhE(aHlEPC6vA!jH(RmuOvC3F>jV(NiAP}uUv`9HMHc|70YdRe5*wP1ziUD;
zWPr~Zv996#ydPI~ydnDW!FGvfU**!|RAtUuR9Z)%tJ2Jil&yh^!Pcs5+Ny2K+4#(g
z{pC{0D4u{xFDZBBzRuZatE>xS6PF*J?*IH07bvI(vdnjPV&v8M6tszh)y^mYVY#Qg
z_bLsF4Hb(|o&D(8LDoC}LAqZo<LnMkr^L-WD^qnTStVC>;7W{5p81>kIjytR?KhV^
zI$Oy+OiG5WW0M0unOi)%aKm`dXK}iSNUdT+t>}R0fdpp({^je%i7or1xAk}mLaB1>
z09*|Dm>ot9MCQ7?UnfQ%C9Lp5G)$n0ZJL?a>s9^f4^3}9i@eO{wedOao3zU6leuCJ
z8hCT)9A|FmxC|K>^~Rsw|5R|RhhB?Uh+}6hv9f%PUkk)c7b-73qn&>);@%##F*v+f
zIwPHC1rb$3n?HCGQ{lYIHZfF#w~D7CC}^nS)Jjp_SS#0|c;@D}I1)K=Z821SXuQE^
zUl;|f@bN=UTg=b=Ph<Cba<R9wVk(}A2?*YE*5`@r`E(UuThLxgm4}@p<(5%AHzTMm
zQAQ3v1%voQs88Wc`aT8cn9Oa@DX4ZD#GCXqp}MrkpX?)dph!~d#*ou&h3ykKD8rEw
z-8RdD7b6cVdD~<o3M&$IgJ1F`M8ADAKP~<2Q>4`f&=;AB7K5y1XB&5p(;80V7L1vN
zMh7OCyMvD{c(3&a&x3EbC|_yZo2&0<nhf63*VMcCntX~>E&%EF+j|YjP;c0aG}Br%
zy0~Vl)oa%Bf+oY~s19lkr6SSA1`O;xP(X83O_-Q1^fRLmVm6yDS&wg!qwYL&4-E3)
zrqES>Fcm*kQh}KSHKND)gRhoo^Tp6e_cKenF%>zcBOdz_sq<lZTSu!z)w}}JePSoY
ziTpY>7d_f~T`cKJU9c~5@B`S3R8vt1V*6l%n8;H-2W2fW`)Msv%d*qv;dK^hbV1GJ
ztNq0a><=*z`-v5p^C{B2zF?>sIl{KRn9_=oCiIC!mv8(YL;%{N!2B6CLV7ZE>tbnI
zJabOA9_ux>-6@udjsq3FH}}(b==CPA4=lVVcN)3<V!G_MX~i;&j}x!6S~mYK)9f?>
z{*t)XLf@zx?t!j_WxVm7{Msmy$>+`%t(u`zWVJ?@;<(+;Ok^iN%Y|z5L@H0RnirpK
z(FAlh@&?z63PTfOQCvsD(7q8VJz13H+_?OlF9?}9bMteIdE?uZ-TC6r)gZp1Ls03E
zvs{%#vo{;AH{VlJ#kAfeecJKLn7=%)Yokj}@pJk(`ufjNb8Z`7ao-vRTg9X&zJMN0
zYA6gh)&>ibKSwMm<n50do?H$SP<;vKGOJZPtI{D?5UEv#2a(?TApbUl@saP%Hboo@
zgSg5&6T7JCRN^BDgQdLK&EcG6OIu2$7_)zQdj{9xLug3~tn&TttaMtOYBFr^)04G|
z)oij1GLy-k9Mv(o0%S7+ndi%iY{s`*DX?FNZt{%nDaRA7IAmm8a9$2kxCsg(SP+aJ
zibSI=i3Lq>@xE}~BgCC^hFzU)X|Dh3Q<m8bt4b^0L4%OxCK=y%4}!QlXlkahX!|)l
zXPpM@#@6Ta&FY=+2V)Y-Dl7Bst)`d{4h5-Aq6Lp(O78^V6ixKJGInfe^{}epTu({!
zsEOnlLXZ6z62!Crx_ZabOIfPsd3A*D!M9D%O5IudOIz@JXR|s-Zn&?U&dGd1+uTzU
z$7}ZB(Lv>lH}$%=V&oI(TR2j_@dja}kuoU4jWKCwF$;WU{4#`E+R^M5tMf13IWS_G
zC@_HCs>*z}Q()w2G-sKgQ)1~S`s@<t?5!R1(eUBixlHa(P0vM#Yef@~r3hN=5tjgi
z9eu9dZ>#k=85T^s_?NhKc7S#g?IK@&a3EQ@N{eUaN#I)DM&MjHpxf~!&1G#TL+f##
z4*@}3d5bpR0gpqiv_pJ(5AAxMS>0=)ja_j}^XC1;DmTjOj%&y)E-6{PS*E(x5hWjo
zl+$KQ@8U{KVa3Rg=644y%fpJUs^Qw7rG)AGLkw=6!@mN5xtTto?w(U*VT%3Gbm`V+
z63=FDpu@qN)?$~>ehn$EAmuW5U4RMW9bCV>a&4h-reOa4**H_+S)<2fKX#ZRp<N>O
z*ATcx{6Zt<&cMU-IM-ymbOe>86leO20?5PUaTR+bS7zitY^gOxlu%y486X;Um1<Lb
z)JwDNa6Meq;;c;d=tqA@BurpS$+vL@N=Ugm6isWfxORC(F~b;FR+eVQwr|9*V_(p5
z4HkY!t!Dkvsy`k<n>f}Qz%`~_i_slHD>M@wDdKRQvX+;M?~raZM{ZQN#H}haY-cs?
zhQ{8Ak)M^E3K7f6w_XP|Ig@TsV1uVC94LgDVV&7y=}({YC1lIXeY<WT&*R>Xcct}%
zY7X9MIAxha>xA2)(1d1t^Ic_v;&jJ}d*WXs4X$HyFO1}rIQGR(-`afjY($fDc3h0c
zl;dvu%8uiZD~0kk-qmoDDT7%fX<R7JWK(N(m$CyeS@UM)jZfVz-qI_>x_nfX;nV(|
zdp10uGgWZ>A&M6)KHxhpl~k|e7b~yiA9Rpz%1XUqC3BnBkkZ<8eN$;!TKEJqjuaf}
zQFh={VZP9nd~w28G4}OT9oZ9&QB8&F{@Ea$k?|qh+5WP#@u?!$`rFUGFT*Iga^0r(
za@E;F-!-|Qn-)bkqDR#wwl5A0M3C1jrC&mhk<b3bp3EUm{WTFlPdXv^)ic>SzA`)^
z0D2~3F6Hl=?e^Z1wPGZzF%I1ov3umoKja>7?tJdxVBhVTqrkWq1x?qcwB};U{6@u%
zVvz&;<f`rMosD<n6q@+6?T=O#sR9`mWm~S;?|m5NblMDr-7HIzu4u}>5$<9f;1f?%
z^_fJ_yLgJxVfk}NL54_>rJ}R7DaUGCeAK%7n8-q8s!bdS+qCn@#K`v>VLikHu(Smh
zd`8II=FPbN^#ETPOH|4ag7=y}FjjjEO}6gCq_f%s(ESHb%`Tp`SC5?}Uzu^?;anJQ
zo1@`;<1lnre96yK*@xQVj_Yhkm>Vj!`V-ZqLTOrQD-m4#RPm^_;_<d8Z+Xy&=Ign(
zz6oB?LeB|NgwbDSe7>63zFmH~2*d6CjQmuHkTd=Aej7U}ZGtG4Skg9IAh<4{54RPe
z@w<;l)%w%skkn18h^umvO)X6yQ$6DQcJY7$^FZ&8&0=(PINw!ld15<&0G9hU?4&*j
zld3s`W3{Hh1e9M@6JQj=ABfIB$AaF!FUNvXrF6q!XvfMJFeasX-by<B-j0mx8i5Y?
zSqqJ1D6<3);H&BAXIAd;DhXKE6s{7y!RV!d9nNE48Qe>6b1B*?gw7lF&8IEB{j}3x
zabXjDbCF%>S0_GC_|o<q*8N~RskD7A(IlmN!0ExhrzQ}NP|nmyl40E5-@KV`MMIIy
zM)d>)<)Wpw*8Ii|_7g|P>_oY`*h!n<U4#huEC`%Cbl@LTq88U$0@n^*0V%_Np(-rv
zTNV9AOG?p}S~?Oe&Hr}vJ>@$)gbzFw&vX(B0UMuu^G>yLH~Txsq|^4mE}*|^r=)->
z;FZ{@pXP!oWV_}Wk2p>*cISy}MX}73seDs6BTsQ(j_x9L-o!5!$&zgQ<_!GPXJ@5O
z2Y@pW4my;FA#@4*J2(mOlYO*JEWl<0)jz3aG40-r;$C;(vFv{PGV%(A>t{~a#+~wJ
zg8QoA7$YQ#*%DJBjd>P1Mt+?ekWf{C%OjBj5b!*>7UfQr-jpVb^|#i_l)b1hnoGIK
zUzjguyG5Zyb2`jmYl`UVmwlw@iZKU1Qxm5xlV7I<44X{}o{Az<V29i7D|1CTq)R~i
zVJJ&M?1SPJZ&UFw79I?~mmsvk<B*X}DZw`ta_*GnjOJ9x6?Eo7KnLV%m_VpcrmxHd
zZjY%qb`N_e9^RGyOsnC{P&A>y3gf$MJW7ag%aw_jls(ZPN_JY3Up3TDisF2nRp6Ut
zli8?>qB&pD)6nxUoT36)Iq@6pYU?N2;mhlf&k9d|j5a2CTyyj5%u-2}^0PpKk&Uy&
zicRm!7|CXNI?-#Azh#aw2DMhBS3p%dzJT!0+3tp`SIL6a-rXkC<p)70VQe32=bJ*_
zV#3Orf<=~sFRQ0yuI0ZYuoxOzJZFbjycfgrWwk2MBCmKOrZg<r-$L1Rk4SyL?Q{Q`
zVg><0aN0%*>?z}qU0<`BA+tp?Anx_>*-DxwGqC`{$cx9#gB~8YW$_c(lZCyF)mxH$
zpGpTX_DO1J#DJUx>E>Du7D^CrpZ0ki=4%7G{j@IYit4+KRGPXq5yi3@8SBb}kCj%V
z<rb%0(xyU!-p5!Gkjj^h;q-&s9qra8H4{%#dS)3`?RQ6k3f8$<z?`YYz#%V|^iWhL
z4H_?3Pn8k~Akq~zT-7Sq&0^I8!_YQCt|%HY|Bm-J%)Uk&HRU<V)Hdx_EJ<~VjYu2R
z>-&H#K!9IGb*XBLtr&Y;$3(RJwg+41c6EVRS9Zd5^k`H2TJm$zfKE1%hgWKL^Qk=+
znAP8ItoH<H-h$s3^Mhb>%fPRpU)0^(8q>6Q#RXNV?jS|jh0lbNxE!lG_-Wqxb(r4L
z%NQJ33S3r$dE<la`@8-5Ag{&07P-l|G)LHf<xG?lZ-|YQiPIFm`fmNTNeglb$b$^*
z0{SO&wC%7W<s3~G*Nu69>Ig!|-60Lf<mM>PR_?St0S8|sC|UxI`jb9o%IL%7kyF6u
z&OwkrUs%W3&qaH3wyVT@6S5S#7R*k@%S}7rQQTlsTxo8R81}wgZ|`&$Eh4S<z*I|S
zVbr~L2YIL0rrCqYWH^xZReDRs{&r_IEho_|B2RKY_(OFBo=I?{*7&Z$;`ubk(Kh~*
zSOB_x{<n8H7I$AXsJvZ{dg$qX*>f2K?X^Mi^@1D)Hbn9)=j)ZaG<MU@o31M#$RFs*
zKyH2Ee(g#+r10c}bZgTfxvtoF$Tu?=SWtfRwk)q9$Q<3DC0{Zb9^fycO?6o2`Mh_}
z-JIR9rYgigmJGx2L+981onoigr~zZVh}4{AHAs_K=GL9bdkjeyksZ2E!^H4Lt8_Pc
zu0L-g!fhk;95El<cU@U!A;C<sunwfd3^#`y<62@kOA^N5$+pASDn;_Q1bHU<8XIhv
zn#L)5@7NGDW<PehD+-drV1d+qjERXVe1)C+#yE3voBZV#*PqA5hFf?J_vSU_M?Lp^
z9sEq>Zs02fRd1u_Z7=a$CZ1tBOiPl)G=1qzn2IZTr<(98K+~xXk4&PW&D5F2^UF&3
z;>vYK#1(XSc%UHCqx))gw-yFUa`2r#dpWc)_n>yv-cx<&`e0L(rJx~&OC2{@4)*Fp
zM~*6km_GFZ8=0(dOxS#b)lqI$CT4=W#g#L4<8&KMH}BE|y8$)?&22{lUKp~6J8xl<
z=__r{u$2xWa;kMjxeQ@KYDtULJBu42LrJBynQRzPZT(tr%dO{QRobpWlU8YGi^RBm
zY-G+@F={D6DBuD!b-X9hpiHBirfN+tiq%S!?Lu~NXuy@o<>3Zau8Gd3%(3ANxJ(wQ
z*!ZlI^M_N)<Ym`p4vuok4Nov8Nc+V*SsNVAykq%@n|WZq@l@Kmm|>-TNoazN+ud<4
zYsM#d#HcC{>@V1n<xQPvfPy8%4MxMq8U)XyvT#6^<jRhHJB)GByTo|c$;@eI;W26M
z?$a9ct@Dn~A6K|nD70b|tL_}<nzK1Prgnx#e4)hi_fB2Pm6u|Fx0FrXHL^;})Eng4
z`R)?O%VBX&%aOj-psc3EXctZXrl!%bB_Rv;<}#ueVnfl`Fu7WgrO#WuKaU}+iAaw>
zFgKDhAB(OlBaY$*H<Q&|fy2B|=HJZ0Wy>GayqkKX03`b}Yf`r(nsUJAqxav@dgy@c
zVO~olqt6@B6s64sL%3n|*hsQFL1L4hc#=<zd0%Vj%@oaSn~A6rP&tuVk-N%vu)DhO
z5Jxljnq?``e6~XKKEC6$`HV?oFn(2D@2jbTCG5gVl5)GeeNZ4uS%g*8n0U!vLlvte
zlNOW>P+!=GE|AWOud!a(=x!ALh#k$i5-82S&M?<pG4rZ9ljZ%YWp$aP=4l4gVbZzB
z>-FUsW%SH+ge$PnYk^zm$60H(BrkqdvT6`&<uSXsRN1k353XL&Mcgj<_Pvm&FKQdE
zdbkMtdV_MK6r$)rZ^$4A8apTz!_kLGg_6hEJ=+^2IDiCwA<8XWJ#$UP(8kbc(ssTv
zq1fQK0)y_GNMSglbb+o{o$4C9vh_#nsmmWpdtY}?$VzdqXpHU_ehXx+e6wv)oQG_p
z#s7}S8LOW3MdKkYzH(YpfUTlceZGIb()W|r!M5@x;>g+U&652dO|w(a(hit=R1Pw7
zq_%D|y*j{FRyk;*-F(K(@~Uz0QgG}VoWz%*cxG$<c}`~-s3-yDELj#Np|);#mg5b<
z4xj+2_lplfwr{$$L{|#~3S3528C+^#{-AXw#`;9nlgnRnOShG5vPGq%#dGglxbW<Z
zSG>jC({LPYQ>vV}G8a|(qQfMs=uU8+^bG@zl9Azr8<GZxB{38b`T@U(q6?qmAK*Ya
z5bv1`yDkNeV>xPCaTD9?0%hCn{OxN<99);fsx;pI2EDGT*tsBucn3EkL{$wGs#~?y
zZo<d0Rd?A#JBWKDLc@6?6j2~Hr;~oKSzM*%^9t#l@A_NN_hAc8LUm=29}4EhOHq6L
zMJ3K(1m^4;DY~aJ3o=1DC3{O!W-I%YN{-fE<BNhJ+NT8uTc^8bz3ks@>&D~_r!!lA
zss~#=z3rRCS234eF`vS_mj+#iN#91@1@$Mohh+3v!!6_yCOgQ*<@KnvUmWb~R?)k-
zvl@4hxg>kBpXBu5jaV7Oqk1s%ZpGS`k0v*YF;A1>NxY>p62iukAZ#nju)ky9b$`zB
zI#(~o`ugdf%i==Ebv)+-hC*{0Szy>syYKd=6N6l!@p@0#>s=cjx{*R}K18}amiNRL
zl9#QbmAob&!!i-{T5A<Y(<y#a=m7DC!uniKE20=`X@F7Fb%A-zXs3}th#US8Y0k^O
zu0#V-a+i6nS`1OUb*>_(a?0<_DlVU0#Lc_C?$7p$h-<fXj!U-sRWTn2>ygUwOC`;L
zN`jIn_?#|KBA#1Yn&OQi@R#U6mtZN14&3alQ}%ujUWu?kly)y}?)SBN7-r;Dmy=?k
zjXC&~zQT9tt^4-ASmjJ1G4=qB?>eTRcL}H_8<c;4T=ew~Hx!-}kV@C4!-MI21(W%S
zzvoIKJ_-+3fu;)UaRt?cU{CxK%mEgPJ0`f75I~cE_J&jKu=}P4Ev#^<ddFomt9pAj
zgT;1I!pzh(AziK+?Wpc<@uF@FI#l<#MvqN*lym12&o}Lgjeaxk_-#-h(zm;{TIH(b
z2YE}+z0yEDET^rWd7$}bTs&{#zDgXZz2keCkEp#1PjU_3l~#!0z2k?0Nj=GUf0{la
z+L%FhLX?9hMGS^0Nj$32JFbtTOdEr+_$Q0nua<%rdtAaP$)#h>LA69i)wj_AhfZ0M
zz87ZMCbyo!VPAwEVfa~F#>Dx-mp2e~$C|dq;Nt?OpK+ni_rklmhnI1>gU(V!)8?z8
z!fTCC;C@@?gr*W}SA(UPRF!c#t}5fywuJG{2iykt+(DLVkLd?D&j$a`$ca}f0Saex
z9G8acwYGQPwI&bH*6g+ioPl11*xKxej-J|7X^*v_SV(MtbQ2rFEZf>KxtiLEpwN~O
zr4NG6JXvtR^@2C0tN{<^7MGvd=qyTR@0F%|4oSKLU9a}Jq<P2jqJAn;+?6*4)vHC+
zm=iw=Y{5%|5ukP<keu&L0G|w`;nH!rDg*<hI|*AJnSU>7^~FHmk~;%h89t|_{rpyu
z0m!^7J<4#w_WFwX^z3o6Tt*P!aAxnEc*Oflwb1Fi%kPA3-uHu=)mxyp<bL7&&E1@p
zm(~cdULYrlSTyyj*ONCs*V1%PrRqT;6v)FkNl#zU7BnFe^JgkwvM${H@=*9(c}za-
zEmZxJ*P0Z9z~<Lgl--k_Tr<~BO23?m{QZTgbHp#z*g>7~Bs>x2=OSD+@cv&GwsRmA
z$`^9N%f}VAFLgn-o$8Sie!%zlDf#kH6-Gc`dlJOEI7csAfxnOo;0|gf9$tVRo;Mlu
z+hV7Dpn}U~(-|Bu9L>}MP!XBj-mTs<AVP3@&TcD(*FOIa2os3B4_TP;c)E0T!fa_4
z)u3tTJ{F?pXdQw&r=iSU!~6_!r>OpXV--ty6f(l^K3(-5{K(lefGK?|e`^)T$z*dV
zyuTrM{gKo9sSnMOXo4g(DxXEH%63FIzc|*Y>+<fX8jZL$aHk)TR?>>@Z(e_KL(eP~
zZVFGSUS23!sOXSdm4j=9s3QpUnF=`}Sy`j2&9XADuDCy)qH7b^=+^REQy0zj+y;Eq
zS!vJyzE={rvHJ2WXLlAWI)xt_=O65s2s-1Z6+sk&!KGvCD7&WCI}WF9JjIhnRm1fC
z*2dV%qUz!@w_w<+hcIfcr(MvPyn3{93eYfT%^RLhpfE?(L0a55W}cNNdAvr8X%Q0A
zz;!l?Zlh52xp~X}BYTQGgV;b_{gVY_xH+^Qu2^QbG>h3%G|pQ*6FxUX9H|j}5UF>!
znQv=1KHB?o?~-{|Qq1ENECLk!<-3Zphb7rHsKvdN54gX{Jl`ABYHDX}rN(46*SIm!
zx$3CDu7rkyNlsR2taq?q<|<MMMZ@PR?RzDu{+ZM?2)E<iO}#kp&wHK+R%w#4m2?!s
z;r%g=4kQB~*^T@h-Nu6hZ|9XabZffyz2Lv@d9c$`PkrVrey6c7oTjxxe8U`CH13Lz
zy=Ajhh0ldtJ>(!hPzYCe74$9(86E<S%eG<hL?7y8ANBoMPYvyr!rJbX=RCW3Lvu<*
zq4@5yAdH!Yk(w9qE_jVNS-fB&S8zW_wlQsL=kshX87j{%T`*QS{(SAJYgy{7s~9`d
zTy1qXZG|l=?>^5eH+|mK!+P!hMgT2Fv9au;`0gG5l#2^cPg+o63Q=A8pw~pd74p1C
zQ=qeadXnHk6xC5SW8mr?S4%xUZK)T9^Ir6`<qRe7ip}>4HNn<)<$_qo3luTDY#`$Y
zcGM|GMF{ryVnIy^&wJxw-<@phPy^t<YnsgiVeQ^rL)v~ecNfbhbel4<)zAsk=hOuB
z0jVuY!UzY3Vb!-9#-kzd*s%Lcgeax%Ms@{<Q?M2+Z5-!$G~pyNBb-WhMz=pB8=?;i
zYhDEUuOQ^{B_E1Lxync5+5DTPUifKhEokVcNpvHn%_l3gn6*^tKbB3K6|=w%C|Z@2
zOmAG4|FS8BL!DRc9zLY3VXhT<Kf<TQe?f4)i4eW*6(}f+Q7J>bJ;;p$7x#PdDyV^e
zYsR_%G7IwJW$wk&dKRs&w+|%Ycz$fz1yTi$(iEE!HhnQ~_djydGB@_GqI>y$YE}*!
zfD{kre{e1JPbIPMTgk-+7dmB>;0bFO)Z6|f_|WszJ<JV=#{8F9)%X5-02TNE5n*5J
zR04;&gA!~UNBtuGrYT!Wm`|ARx$>qS2n~E7%8I5U?z!lgBrEgP@S(F8rVUBN_ph;9
z-sP7SMI{r!th=r5ZI$mFb<kTUDEjeIaj%d^RHK36bz6x<@=DwXP3v5!6L2$E4dQvL
z>asd*RH_@buNUu>Tq*2{YZM}k0UO}BxPVY+e153DFEF^1*%6-kIRa$Vu!^AP3#+ZP
zp63Xx(9<`EN_t%};#R1#jlbS_DMoAS>?^mCCe1lZ$Ydg-dy6K}=t;0@YZqx;NXA8j
zY|rgUHgz$pAdTMlS4kRs+lNEHoT`4>o5EwT7AW)1qyOpEIJaaq4Bz@*@Fqxvh%>0M
zlF>t%X;ToAHRHm?18*-7VgOZ3Odn_?fSMpk*c^+_oi)XuzOdGYH|ZR*0Mt_*;Y;au
z?dAuW=*U`--K79_hq<x1-m;QPotm<J>|{ztwmGXD72V!z^~EatIP<pIASjfwos-nf
zJ{P;*dSS#U=Oh-eQyb12!U6S~Mu#MmW2D7Lv*1#rSfK5W^|dbS<B$)$4BZ}x7-A{L
ztT#_2Ig_V$D$^DCs;7o8Ta1u40?P-%1iGHCCCnV#>pChMQL9F;zMe;EURKGrSa+7$
z6RYsnHl9y?3{t4)NNUTC_Ete?pmryr_SNBANPNJ!AxC3HlAydp|J*(al(SKVd66Z3
zi-IyLO!D65sipJ71fkX;OQ(j6;%HcG4HGbi!aK=}wL8$r?O3X7ijt)AnG$HX$9HrK
zu#~wn-oL}SmNt6oo%ubwQc%M7NcCAD?5R&}6M<9#bT0En$|HX`VJxcC|5w*nKt<Jk
zZv&!W&<Y|wfC$Q<AfU7|NOwsq-6_owq5>iy(h`GoH$$gLcQ;6P!_a(Z@U7o}t#8S4
z$@Rv$_nfoi*?T`*XX|`x%(a15kgj~hQ2HvI+cbYx$3}!{R&w9pLe(68D&z!txm!GM
zmU?KZT79$lo`b<?ug#$~y}`ojGjz@wJzo<)w6c4J;5kD*bt@;X)Tv<(9#y~3L?lBQ
zGuB6<X?Wd9V&3S-q2sNeANaRnIAfL-$sf5{^6n=PVQRkF|CUK7=W*QE$z>q%Hu#OZ
z+UGiL53K@Be2D?N_yHBFPGy?p*=rP$lFBriS5(4k--`s4;}mB!aK3(xYaPV0Nl>#s
z&m=U_6;J$ePT^U^h@a<9rX)kdeLpyH3C=TK-&dAZ_Eo{MwlzE=v4ZCy)5J{nbcduV
z$73bfSk!fh%)Xgv!rfIgB6c(-LeWR>m~SygCa!xSBKI(v`50C@gR>8ya8aYP6Yeoj
z%#MQ@fBWi5385(oOgcg#4hDrQ&zRXkAr`vgCK8*_2}XlMV2M0FUI-0_sc?_zr%Oj8
zYXkWTdI+O`e&S3G%q`DIbi7XU#HoQOHUL3AKNNL%y+=`YeJyNTQo813f|%k-Ldzk!
zN+4TBRtSnDD};&dDe=qT>OAl2;Z!`h{3oi;2Muh3imhGg3NrjF9!CbTv38xro2hd7
zVLQsI77`2g?5FiOjR-E*w?kSbQin4S4NfW75=1_V=zzk!&qC>7#v~b29l*YMK}X9A
zi#Nq4G{!A%$0Q0rJBhZrSg7^ti0hssF5`9BFVmDs>Yrc{qH1k6ijL}hrso$xQ8G;O
zH8Xo~z~8-`r$~I$Y)C7@rM@rBs#rOMPKHT3V>bbbYor=p_Nx=f2eH7yhQ=?;x-i@2
zv4KR&8p0e9B1__dj;e$Mabs|l;dp5$dEF(X{oKO1{Zeb5m^Y$7_HN9xCly<>;a-?m
z%E_^U#aK$nOP?6eHsrT~sIa)ftqq%G*5LlVojo|Da2)ALC@}4rtj!Qn-M4BiXo+pQ
znF}*rUlbz!W3@JX!H5|4vn_`;JSD+Ic~|d9#5$hT=DHU%6b_fhdKxe8En9r9ytNT4
zVyykH=bJ;#M^6n5-*$+8Sx4=v5F1(=0n0SbGakQY=5yPl=;vl5D!C9qz)+x!%_34e
z5v^u=p*bn~3_`o?jT7bTK)gS9_jd~yzl|$q2|3@vYaf+}6ONPCN2vr%x@8_=xnChc
zp=|^kC5#y^K=oJRl%`1n<WQHsv4~L`k-v66aYwbC`bmmR&fY|N>OE%FvYkY94OzLJ
zMz|5b>-{WI$3nHjaClzmK-9fUX$`|Ib>)b)el(a}JY-oAZDsiwn|=nJuIu#qM0EM)
z@0Rc}3@78|qP}pa`p~v5P2}PWCT=dcmYa<?>MJSSrpEYq9ixe|Z)qa2HT&vb(@%Ao
zq8Xeicx&I;xQx)#gVNc19aQwDs4=T_)E#A9B^dkc&em-#G75ij4#P-$**Ha)gGVU?
z1?2&o)n-WsqAuBVUKs?e!Rq#N1LS%C*plh=_>_^4MHD2HFBhLYW38|(pGX%f8FJt>
zy;OZdnhH&~TRuNpBqN6qUyEv*Q`~^=r|M|SvL#Z@3=HUfY0vL%lYREquZ(ASpv0=s
zac#7Z=A@_&+BhEx(>~swI!6wReG%2^OJ%x6^d)aT^59p}h+Vr13*Be+_PZGr{9qb;
zqWeNc12!u|M%fH}+SoaaSiY&>;4Qv>7c+_;OMv*bQLG``%NE650SAhuoKl@TSG1BM
z&UAaT)TEKRZ5H~!iWDcD(1m}f)5U%F=IIY-n~8?5$5F}7tLb^{*m2It7E(6o`FVEh
zYmyl4+|xE^<Uwtqw(gV~()u?R?`n~b(@|*6`Oa=mn(0`Vz)`n*(QXPeMIKH?hN0&*
z7C($lj!CPJT=!qLkZftXFaAz>Irg!bI^yJr*u#>HwpSyIX0vL_oCa==T)6j*@>ju4
zmotg6)H{kM^>iB^ZLGwTKCOvC%-_{BP55@R7!R8Dd<WFk2-j><;k>_Ma8DO9+16sY
zb+V)C3XMAQ1Y_+Bs!*NL%oH1y``0R_*Ax}FQf?HH;9~icMWfDV;3`=!H193;^1Lq|
zM!wDLnukMA>?(wqkyFl&Ar{33u@=bm^Cjp<otQDPq(<k1n_Fk`S4dh&vPOOev3ys@
zfKFvTvV811*K?nDH|tf%YYTre`OnXi=hnG(%oqt<=;^3ExC~KB@9fk<?bSjD!sKQ8
zL)a4vQ4@9*st8s%?FZ&mYK!JJDTMpp5B?KG)7qh8XF*WP)6s`CQpFaI!viFpov%i_
z1!uqZo+Ro7ihmI~0=~hth@pwF#y9^#1)PfJ#F%4-(LS;x^XK>F5w<G|q>DwGG54ob
zTTo=1h0k`=k~ZBeJEHo`D=y@06TihIj+UrMD;W(k)m+<?9bVERdG&N3wfKk=I(FD!
zT+aL+gGt_RV6c|Z8^%hM8Y&gH7sYggfN$*qe$@xxioN$!t}{Jt#?EC2JA&j`IrH5Q
znO0i1RmRquQ<nNubp$moPU!K7nzOG}o$M7-H1X?SxXdVPz&q?K&mYh`<Ft^$SP$MB
z?R1~W#uXZ*_PCCrL@iCNs<v%gwNHO-25?QZf@=DO097eO^6?@$*$$as--<MCiQn16
z7XuG$YkajIqWg`5Vw?=qyWJp`dnG{EQIK+??)=av5P9x$z2ZDqay`TB-ukBF(-C0;
z?h#2g?hz)$(}&8Qb$gF=x>@tfPpOcdE)-4)w{1R8!<sEhdltCf{PIed@GaeimN)vF
z6HmCA&1ecYbVeRzcf>qlRSt^fJwN-RYBk$YvXHm*)HtjzE<Wk^3)hQU{|4f^2Cki9
zUHVx)oCD2w^HaB89G{Q1SrNtO6dGh&I6iH7P#-47s(TQis`I#E>l!`xHb_Q?hp*5$
zeB`_Xk#VkBF3j5N+ELZEKsHfZ74UAD7G&mXnO>CVj;N@Wb-G_v;5R;J$TAak7((k3
ziz6Sycjq?*tS@+Y^`&rD$0BkeCdh5Jrz54j(QBVGBUr$Da&&RdYtqPMou98Y#@Hul
z%S{zWXIHKevb7$r_;)$?bPs&WitDpT2%x}UUG}SQml)f~%goL{C@?lMRQu5+LrC)5
z-hwbfbWL!y6c+U06(zkyzTUbQ)q2tF1wz$+hm53(m2DjI)$*q9ZTaJRJ6ZA)JZt}-
z_!S!_FeAzJ5Sy7$CxkWQdz3V^=I<9AYhvZ37KrA`9y#8Z9DafGE{`NIlOv~bUN^^$
z$QTV*xPDNY{EWd}9rQfU`)uU{zC+y+)%vL&@96a!Dfhd~N1eZM#^&5z9hS|JV@o_I
z!rweHuYc}&QDQmKAwo`bjG9Pa(&fQ|1daP2CB||WPoPGoeBThaNaZRvpU;TgTwi5l
zx}#9s!Jn@AeUTVm-3arx3nNfB$Rqo~sCzucM18PP!8-R1UM*l3aA&}6lBrV1X=-jK
z7!@thCUNmd@M0YQAayrn(R-HXE+!szWyde|BO8cZTy9y{`}zIM!6$UJxjtEChV`MR
zM%^_YV<HXW;UVisi}pnm4%vlJt<gb0#ZFUiALk8$nA_=R*RqV^CwN<d6aM~uwmM9@
zxp(u$X=Ik*qdRi9oy&*`)QG4IB&jyUCuT))@>dznf4+jT>qfPmL6b#ws#;ChV8*d`
zFLujP)m)N_`vv;SgML9bNhaAQPwpQzQEetlHGvOr2Ub>o96w2vnEfLx10c{@DSq$}
zdbN^FC$ZR!hI2&xBC-gz7G$aade%M%&9_2sNK9H_M$Jbx`ReSHieUV1;ZLDll-wxb
zi`X&|)<sC}hrXrY;?a1(L^MC|;OPdpD(SO~dzOq3?<PAje-2HS9c^O015uf6gq?pD
z`U)_nYt9b(8f(|ZVit6;WRm0`jxkzqjPaeOkuV<+6G>7_m~ImD5s=9bnT5JNN7ZLm
z;pBX)cz(e#$T&1<=&PXW2j6)>A0!~YR`G7(D8d;PQ9f%v=H}i@!(63B2TvIa8mn$F
z9XHfGzve3>p8^V9K1zZTr*iC0!Q2q&su8W|SDPqGI&pc|rjs>CUsS(<MVch<L5t|=
zHm5wp!EzVlibBx4?%$#mQ^a4h<1)KQpR}sV^n7X%a1JdCon*7m^I>mH^#JS#$xK6?
z16?YwJQ!4c+?RqH++8Tvqa7>S3&t>buKNI25(E9R)(ZOHaD}FE#s(Q>6ON17USmUA
ze4B}vdXq<-YD5NKJim`c#|Y|Vdi_F1{=x$Zaj^KI)x%;oTbzLc3%hC%P8zDPKh^)h
ztm_XIYWn>%KuMAQsgpE-69=(f?XRH$KNXK=x&d;jL|>sb+~&7`j7ten36#w+aqnQl
z#v89a`QG;*mmnjs*wN5|HI@k{qe9;sW7U7lW?-~;ftBq2grMLhFzZjT|E|3W0!QH=
z(sTa8059)wN|z^<blex=@(=KNiTwSkcao3w6<WuAm$_+tla#B!6C)rd#Pf!!q$ld?
zX3(hmkDfNhEwquBKJMNx;0A8~liR4^HMTm@U9PlL_<2W`iZc(m+v82(K?y&qmyX|_
za16L@$)*oy#<unCS14DArX@0VTV*}jDC(=c%}}B5e}T=VW8^7)xFvbPs}ckuw8g4q
zbMp8wju*v-m5=_$1L->D{r9Gvo3ey`(p(<YsN=d>S+i-t<p^9)KN6_h7F~aYNv^_)
zRY`;P4AVyA?}-6GRuvde)ibx`jKqUi)aZj(-ufQ5$s(yt`6~uTN_})nP=e7Ju1bjl
zzjxRkVs5-J_{+70n28vmX$Rg5{eW=Z?rd(J$NsJXGfmKInvWXwe~Ky7>}pZ=9nN82
z9^g7>U!gm0C!tH2$@#Z$Ot{Ql8AAfR17LD3F>rHpL3gEs`wb{{cUqG>embc2bqcuA
zS8OeHgl4o)PiJ%GbMjhhVx#8m-W|h@D8zS>G2;1;UZb)+CUKrPx3x(V`91~yd76xs
zB!e<4>6QKac~!#er;8?qj*}KhKayx~`-PtGe`5j0apq`ZIxjh*2Wm;-v-2~*{8@v=
zLi;|BB86#t#%;eTF%(lNu#jSU;8s5QF(ME>tZ&~EgfxmXJ4jXBza($ty#G~<L9pLc
zUsxJu8UfYHaz$+ncE_{P<_=euz!XS`)9(mp1p@4)R#BGI8LK#bWG#R@dabRu`p%;&
z$v;?(^!50@ZnI+cgdCMCxs^MuTqeCq>UcCqHWS{8<>NF*>EYg(v|Fua9b89khQjf>
z_+CC20)?SkjOfLW%Zm99O+|)($fV%E_h!O=s2J3MW;Uy2Xg|PYQrLgz@uNXW7F&X8
zYc50*@9p;$I&x`|Qkkf4<KhOUfYU(;yIurM<?u;6Gi-p9Bpr|ylvRPEc`mETO7$b^
zbsG&RN<*t7<=Lp)d@ODeq0{eV!)W$_tTN{#xQ3V_Y}Er{Vw$de{0dD|28$;JglkJr
z_taS%joQC6N4lRKkAPZzbSUu`K4Z=Gr^PXp_OcmM`U42uBFI()N#)Qttl}sOg)C$!
z7gHDumc#MhoQz}~7g|OTl44zex_kau^w>J?+)iJwC<68CjEMvt2WaAov(^lGO0RIS
z4C)vb{Ag2up(mI2xnVo(!+nw;efqOWn$p$Ki;MQcmV$YoQ9u+0*bYgAA~?CYM!|rz
z6gA9P6t+)6y?GHihv6`&T+Ncaz}S9R?AyN(PLirKkwF8ln8z-6kQ}bVvCq4L$}K!Y
zWfs<DGNN5H_(4u#6)LNcAGP#`Uqx(qZA9S4!2C}$S@cJBW2|L7uQ^+{ih~Lxjz*oY
z#|~&F0ji{dK)@tJ!RM403y3Nv=P!Z;&xgYwsVThYHT?$ZhA2o2`hS0!Kn02%YYn3r
z%y&D8kptoOT&9^kt3zze3a*jsd0MgSrNXi6m3s9K6VKmPxf(U9j;Z&~&iDuPBVo@W
zgjPTvh;66HJ>NX~o({@xn?VYNrL0eO`AS9{bagOWWBwXz-lFN}{>uC7Ws7kKK7yxp
z$EZy!S%IUZSjS0chhA}}5p+#>GVxu$(`j$&O{O>(iBpN`RQptv7PA>xEhQGM{Z<k#
zU9mh4S-}$Isuo4siIvx!biO96>1DeK8~vz?lQ8}0bp^+T=ZnS@e!$QbQR}Pp+S+b|
zz~fN(lEm<vBs3p{ZadMORp3Eut_x9vn+0uaqAl5XP4P_dl#KAqOMm;$F<vNVoJJ{A
zO%;7=P&1=-F~f-c2>1oJAM^6u;wKHg{UG?>?FaICiEYin3ktVSg9#vn*RaM76o-DC
zNuIpj65&F}0EDuy_bVk0jyeZi@~pTMPm`tc^ou7Qw<y7Z#%YKEHkjL@b{ufF52fNw
zObQ1E22RD@5mgF~=!Gap0c2zG?;Lrs#35qw>CA7-$E}W;&@s1aLfmk%{a=jsm(rk^
zt~<1HGB@+A_-!uw<OFnari&d*5LgkWu=w<rtbQFxocrnatBeoJD~j0lQb12Iw+l2M
z^a2$Z-YA`o);sZdUdiIY>MKE&oRw$D;L&#(x6nkHAo>-l=bL<jNtT`;L!uKC=epa$
zHQPWEkj+MwK>}8)!}X_3BBtrV{SLgUe<&u&fh@$8J)F5t0$GdIB=MRidOg~2p8QH7
zb0y%~<$m~!5~c-B4`WSeY%1{@2Od?kj6g@84qwokLk0*C13=4r;)Y7U8O*xxy7l{-
z>tW9|*S-8-2ZteeTvpm4(uhg@3plba4xUpN=keCBYOD8KL6gE|+>cNcd^(#L`=dwT
zGje$ez*o#C$M2sk){u@=U1*v+P8BvUbeJK#m{^O)E~=X?tKh*CZf!3$O5@Ac@>!<5
zE{RXUxB+p^WK1&zjPfhtut`&A_9N+*9>W7-u6Pghc39=fzPEI#tYNfFUfurvF>&da
zzp_ZZsrBR;b5Kg{|EX}DTl;;`py8NB2^1=-@yB$4T;CE`*C$a1tX)8wT4VdB5I>W?
z-mm`x(qry@4N8*N^7HX|M91YaumkVHiNGR9%O*pthq>b*P?iv)_FY1xh~=~Cp9Nt+
z<Qpf(dei3*aI=l=Fq-dACuO3h8j(lmt?}U@IhsKd{4j!7V!a-H4{h+&+G2U*42`5j
zzbi-*C{9T+q~PaqK_x&@Dz2B$r2@|#_?;yW76(M;O)3?Sh5}+#-OQm#ntS7}jn#Y{
zdVZARgl@r1=jlwb(J%5^F94rQ_h%rotuq!|_|opF#R0bw5K<!Rq2D@hh&mX;nJk>r
zKB=U-@VHPW_I^KDdqG;G%gwJf`n~K8!Y<(U_x%)3`R?z{+z7Yot>-@%rS}9x=7Vto
zH4~)R?b8aKE_NgTQSijcl&r<CbNE{P1XsZy)Li|F`jzTjOaYz4nBTjfx?+9dp~nj{
z7Y}ovezT&=NbDx`O%%iHm}~A{A(@6fF`FdjUGkwAammcppD14$dY>V9^PW8R%nQ#h
zG6AE*%HMWAT?i*9?U;yI?%`UoU&ZR$u7G@JIJD}ZAlGBdTgBu+=e(d&;VNoj%1$=Z
zCYEZh;%)v_iu{3j6SMol_j;7O4H|G)9Y+irxe}nq8>A8A0#STT4kM;iQzt4uXojkt
zJW4FLjjf}fi*lgA&cYIF;$XZ_#eIRC4eu`RASwSzR>!k_B{S{P$Bv0b-^xH9&%AH5
zJDJW}Kmgt_`(j3>`S!!yq=5JdG!0c03}QQOFehfm41p?-2P{sVHF9Yhg?$c6#6<6I
zS_(`7k3-5<l@vaY>+jU<qydqyFn{pyRwwVegG`cL9Z*Lax!pH_6W6rjvS08~{D-D-
z^s~VbG0wtgGL>$YlGA-`Mq}MC;G?7uE){r&kY^W-fKSHb&`)B-OEI?=Xm3+6NlQ>i
zadvz+n7aQlvx2fqz*#d~XRG$g;8UYOY2F>N*~n|=T3Sdz*(eI)3Ge*$j(<_FL9qB%
z$L$nLh>}G0{SItbJ<X!EU(vjkAWnb#opnTA9&4A3wTD0L4r5lQ-YcOEQgKgLr6Wp~
zf~brL@i*cMNwzH>gNSo|s%!W~FM<S2$MHQM#PT|1*-u#s&hGHN4|fYBa@WjpjM!pE
zIF4Cdox*>7QGLSKGiE<#G4@(VY)bMRCAey{Rmb&sM7F8Ud%ePSW7|?gD8BRAGDD{9
zL7T<ZszBaO!&ndZI)~yXDUIZ4)D{Ep4|f(?PHSNK<!Is6jVylQFdvl{btY1TWy~KA
z85DL@o=E!D6X!GZeor)IiC$u|7w<RXI~G?q9-$-fipt%TnL3HH*EF~z*+1l3@3I`q
zJXmQQ%vpJ4_;6dYDAKaUhyuwF{N184^it}hcO~IXtk_StwiCYkHZz~B=}n+U+x(M=
zpLbmKG-lGZJ3m9Y_DDg}%T~(WV9Yapj16g^-YLA-(Z%&(`|3$4KW4skQRHbJqhEhs
zN95XNIQ1*>SHKl?!)v*T#wtl+biqvc9TDcx6J`a9n&Z~e4}rsTw(ivqq1&}25M<Yg
zk%ktH2f|=0aZ~EW_(`bZW8Qb-XeNOB-e^M%z0d@(?@hXoiMhM9UlD`7@H2EcKSwEQ
zvBmNX_-B;6zS6?%Q7PF(;*O_8aa5h~AMrel*la@fSC>@=IlWra#UaoH9Dh7*HpAaQ
zeK`kdwS=8j^@w4NQ$ju-VjuW0=w}FFpEB0M<8ir&BldYgT9_jZ3o0?igK>a6QB-3#
z6`{VkKghwPPUP|W=e%8YV8&vw=ski*Hfpha)JnGX-(2RCY>yj*+#|GC;5d)mcdW?>
zWa%2)^3zo;7!}M!s&C9f;~xLGk!XBLnFg39zWWK?!KEF)HtA7=iVvxv3AI>Yw1)16
z$gX&-7r&Y*C?m<wAsDss^Y}GpDY-9By<Xt=V#o@~z6gjiX*72C*IQ$>h8qQta<4o<
zDdw=SuG`MfNZ^z`Gb{KHB?AOdG87kGS9y4;A}$pJq1O$xk4dX(&x-XHvUS|nH8y&M
z*JasA&!J?b&@idJW;1TA%B>ZR2&bP)Y`(dId~9h5LF`D35hk5`KNCIQk-sFT&WrJc
zt=N*Htx;pT$9khBTy~95H;sSSUp;8dWOF)s;o^KC7&MYhb~>5ICgz~r7XG+hzWB8<
zB~X3FU<msr+5-W&Fuz*Y%}NuinxpTFz1%wRx0{tm86}AGm$yTV4P8Ejh#@kC8^YL2
zk~c~<a&{pFFvE18T0VeI-!<41)kYSr<5ygQtN?6vS<d#eTd(~YxU*I-Fw_|Et27F(
zOK}8!0-dcuu7xbNa*S0}FZ*x}OHz$?9~8<86w$0#rk@>0dRM^&J7s|gNfXvOrY&=S
zKo2V2){|c@;8x@Xxog#v4sq)Rdo-~QxgraLWQXTg<PdHVOF{01VS=c=*;mdkG<(1D
z&AK9USShE21EMk$(WH}Z08D6f+?X%J)o1iP6uwQ&FY=}R`;(u9uqK49N`}A@?1`UY
z3VR6ekoI}1O38JG!gjxJc-*7o<@T#DR78kpziKWHe+n4>e3$2<U8f9U<+_;7JshBV
z@oOx#^QsX-cg~r-g=~~2|H3%YVkd9<f?&ciB6#rPTx{&k-2G3@yz7S-5vBxfAwm58
zt7Mptt!xAwjkb5Tytp==jUCh`30YYM8vA%G3j{m1;YGOW6>j#9)Ep&qH&N=fS?J{&
z4iU~RBSXYJg7^<*9mYa+j#H;bR6_(&txnASf=<Dd9HU4E3p5e98_p6?U^~^hMH8)<
z*`5S$2DhioKKlV28!=mY-><*4v+|S_gqW{oJ?kb6)$w=^;tuM@Y<#FtI^RJxD{m$L
z9Ic8GXELo>5l%nL@@B(hMq^cS8%Zi8G<TS_-lWi8btfSYHpfLd*hdn|yH=i>UA@2)
z_t<?kAfjrC1^IYVMD@HQbN77AD&^D9Ypt3ykuO(hs|h`p*NH;GN8wh!A%mMO+EinP
z2C-MitUUP-b9vk6pFkaY*n(GN1&_N)(&pqFhlhnIu(fku+>D|houN4^Z+N1&>w_~7
z4VJw`jw3kN$CxKAZc|uQ+nWaVwK2&aw?Di<37&5ZI36IJ&kbHZ9cYuPzP*B&y~44;
zF`{%K5>JcOag%J+5jCzCTaDshEp27FS}f1Fi+wh3mW#)C!>?aLI{5gG7a_@Oi{_O$
zCzt(Si?_B*b~1#s1em1?%V2X|evRhy8Wx3m$hCr9LM7jaJTvEN*z7M!GzO`Mdo;1F
z0gP+W&Embtvzz%h7O;Lo&%K{e9va-67=~+eJaWQ>LxB}@w(c<6LAWTB7py9#OWBy1
zQ}~eI3UP+N{eecqJdqlyOM;xeQr#V1pqU=|yk7O#D5qe5altsCcxc<LGfVhsRND^D
z`kA*9kw@*8&#f<SMCx29zU-aLy+J6Yc`Umbr!ruDB(@ebQm+{?Y;^oYItpFdKeSY=
zo_#vym>ItE^P8+dJ~>mYzVz;5#Hh%?sCbeJUhy?zuPwr9cFvw`UaN{aLMaN1a^)Qb
zI4bmtCiUW^@Q1dIlQk<SR%C|UbRY@Oy0R#)jVy~Fe1-RIi+eS!pWwIn9CsCeJt583
z)w+n>Aaes>v0?p(54qViiZ}p!^n&lPuR_Bz8n3M%_H${yA+EWR%HN}(5OexgPORc!
z<@StDjzB0I)-up9nhwcHyUoGc$O<We&2Wt`8W^Se=j%UwM&J9;a2<%BO57$IPEjlT
z0vHHmT`e<WkaO}8q3$gc`?3Olde<D_(t-!C>E#;_abLD_kjz#*NgD#J>)9FIY=DyV
zDD2_Nb6#fIP4Du4@y!oBa}_Y1VR4#M9@3iHj~8>vB{zGkVWwXVg^|8OLb%pZ<x`$_
zsw7KrZ@^^AP581Jekwt+RMLju!D%T+93#9(*ckRV`no!wZ4wI$(bp2n7ug-yrc>6n
zC!0j{ek5PFqD09_D1qsGc2VjUV4U1_A#mhNCcV(h1Bu}K=8tb%M$I)hFVP82NE}xX
z;x~VF__l^(NDJ!7RXDG}yKl!h#2qn||8swS#jXNF-WtYFq;LvhS!=yHQZ9(CnKW=D
zGX~w)3c%$p(XIW==hmQlAl{jxaGF^44Yx@2O-quv%1~y6{nAjb@<4K53VBU=gY0`Q
z_wA3YZpS7RdrOIpPjoHnya`fP*p8+yvYP5}#%fPCcHLLrO-ggC1)Uv8QgxN>NC-Fg
z1R}`i$>Mx%9mecrqk*9{nQS*i9z3DVgjfss#flq8EA{!U>IU+QtjAt)ua=|Q&x+0R
zgcywvjDiCz0aZ=ZT)SC?=D-Asi@nkqxbJ@B&Rf$K4|5KSSo`xM<h#aOt9Az?)EsNF
z7s(m=g|%m(GH*20n3f2a0JDJ-m8_dj@_fzcKKAv9v@)H&kqf?Xwef{vKT_;_FImra
zY@%DAvzHoeZzam?NlbXFcWN6Ez(aiZY|}@t3-5>xOKC9`Oc<E%JV?Y3R%v(~tb5I_
zM`cIr`Oy)v!}@ljcO}cA1TQj2r-9xL5YdKcei$-~oc&l0q|d^~qdK<JwjQlXbMr>%
z+PgbM8{^b<AkA&pdX#Hy^JREM>vk79+W*xDBe)@1G1V};$E2B%twyhHZ~}iiu&O?s
zjLDW{e}C}pw2*9?gSr{3T@&lT7s*ZBhQ_4F_j$w_dc(?C>qA}j%Jw~<5H(8*oDbh|
z)mYQsYkk<(v^+XM@=N<|9NF61IPsHLx9D@w_RzLn+LxB$y|JfuDf#QqobrC-Xr)}N
zu{6CE2R3yS^9VDR^8M)qBV0Oc`QxqSm%(lcVVXDYCy0Ist~B>sqP5o=DI?RKSfPFu
zF*WHh#P7aVEbLjv)UzBBIvI}RoEK)3&sKHI#;JGNV{7Auh;^*{hEAn`7FDZN^@;pu
z-J_lH$hDB1>gCBSl$AnwTq!D4OxGo@@Mexj+3}#t*<&Eis-%%;Zg#M#rZ}fp8RYVY
z&=LBtS|6S&N9rwh(|be}1UM9>(m;w}roUI*5>HPht@4yrD88@YQM7Ke4aipm#9oLL
zYox(A+*F&i{`QL%syS!69lvL>9v5fYd*8(L<5m{Th5A#5%(RP|{XI!}EM3Oh;UCz!
z;2bVRZ)t)DQp)V$tAciwrZk{#F1oal#LJUd$l5w;<a*UXAdyZ#Q%~an6Af8Q;up6-
zE!(3|s&|JylO@>J*QsC3u9UJmhXxNj9{EaaJV_=vwgY7oiweiXYZY$DqvJ<OZi_S<
zdV5|}!`^paHI(TYk!VDAr%DdL6u4fq)D(uUfQa&Q=>I9(dV@a&&w-91zo*zplKiZj
zW|m#Re!GQA(FeTz7oJceBBsw0f}yzuD{p4svH)^+m;O`&5E_w>3nHJFfM9r?x3sM@
z9GFFs3Y=s)MvYf!PNvFMq&%}(X~;11q<s|+c|eo}tqEm)8MTxnsad_5*DIk78xA^`
z%x?kYf$8qOk8;=sNH3vi66+EnT9q=u;&l~PQYbPdyq@+Ym)WZmoy#mmUz!9+_uF&l
zo}fP3K99voAY~LWTX+rQpqO-SVrN@U9s0Skr-7N)He{SUWMVa?HEHDp*lXR@)_&Kq
zP{*~dA*xG7!)#Y<E}$j&UupIjg758-v-DI$>0iCBX@hbg86AEYqMe(s5g0_e32Dn=
zrBu^KHGGWxnXM=HpfcE{sN27rue=C5s6botDCZre^P)NTGvwGkJ$m(t;qj94>0r?>
zZJXm9-yg2Ds!9=EP0mdR9ICNC1ddv_i$r`6_&533ba@OA@LR5>OvOWN9?Qk49@NB%
z9+o)MbQuChaVD{Yntc^MVXkUr%C*;3bLBB~E>p1FBm2=#bxY8B|0N!!Pwy!<&t5G#
zj$fONHL}7Yi+y^3nwr5@N95zP*<Nnl;QV1*DffjZ1e7+;F-&VjaE61H#7Dc4e61je
z^;688+`C$91wLx>N?;1=`QY7Al*Uk;%R@@{(xJwYmT&>hss3bb7mrSXmEgQsKJLI(
zZ}xAi{<g>TY=yF|??b_mo>H)1HoigoK_JGoQNXPuqU`i=;MPrmy5+TpqG_N367%4r
z=O`=^BUre)FZ4vXY>K@;r?HpQum817MGSh%(X(z0)VV`8n?{8OCOcc1sJHccC2%&V
zP7Xv>@c#8de3`+GBV{VbFIP$_@z<%}kjH0-vjMlEnFiT3Ah>iEpC<6fEdzhEyo~?7
zUJ@|pxagMpK&NYtSZAogF`ONL%2C4Ig&I}46DB=H?UII?NOD6xK$oSvrJD>sN~GH7
zAUR7anRjYzVH*1qBC|8v9d3)vAz1k;T2HX14yr%3&-U0`f5rfcYEIXW6uhXEX!Axt
zrcuX|aRsNu$e}gusTR^l=DyFbqFejOJ;ZW5-+Hc;xjoAceR+Gkh3q#$<)*-9CSrK!
zrgUE*Pb*3M_+l$65+X##cNmYFKefxPnLN?%*KTQsqT<8r{oQf+kJGsC>tO!6yK7m|
zL0G%zW8tsu{A;CTxSl7gvVc481b>*3#=|^7$L$5D-ISrw8IbNSH6I2{h9A$K$R3TT
zU}vj7nPUUpfDpAY3v61Z{!CJjSG(zq?%XN5pVydCwZ3a*Slrnk3>=WX>(~v#Xn^L1
z@AF{JD?L$1A}78w)mOqA1Uf6&HbwW)>R31r!p;j4zHgs=D@UHvdY;4$Er|Hv${)9B
zCbSb&nr^)Z@RtC;$0G4u?)zcCC4IcEu*&OL?fHBa=}uwsaT0}aHiSeB?Inrrw=yd5
z-}+c-&hPfMYX7(DM<rz{^o(!CVju+F@Q)_*d8CMhhKbVWj9wf$cPqUJr)n@o0mmUB
zqL8h!+h65?@7Q?O46tdV7~A~6b8%~EO;tA%+<C(!uV};#DO<(ob*jJZ)taldovC`-
z&f?G$$aS;uR6mpLno1doUq8zglym9$1PFP+ngYvK(~|CZ?SI-Y=2TrZ2&&oo@dpT2
z3c*0|Ue02N%`8{AzfyU#p6j{em>z-fT?MO;!UX&7DxvTiVqIc+KiXv3gcK^k{pp^B
zK_orWJ2!utTxjS_G>HE&TYth~tfK-C!)qlW6Q*r~n7sB@QadsP@Rb{}1+90mLX;y;
zc7<9Mo*JeWXLsF*T?_P?%KH;{EPSjGjtfHw+4Id&EB%8Cu6)UozriR3$Uv9-7YjVf
zP%gG@wE%jEc6ItpL$~C(oXor}*?*f(LMgNj<!b`H;FgM<7I{||gP>+jb_WnscAvW0
z+l1tj7hheY=-h+F@V4jXIVb%3d8BQ$Wz=pwmtU&@QRVeLHHRj8tKmDdaf-xOvN5wU
zr-m>PY;K)f&OaAr!h`4yj-=x65{WYO@;~}WKE7JE)xtEw`kW|izK*$i4<X|lN_?h|
z*!KNy3%I^;m7%j78}D(bw=B7Z;)xB`_o_C@>+b~nfBnTa3S$+ogPFgI<?RRvXmhZa
zU17%;skUudUv$l}@(^$^tJoPDWA=MdVK!Y#6Ik$(#!}y0QjH^Z$`KhXVUo%9+bwA4
zsDAMlf?LELmhR$*9kVqnAhUVi#do&lc_&ylu6A+R0}{S0JF{pqYDuIU=1vrE*A%$F
zQjwNj@lG~n%*yEkE*uGw+x9Xxo1JT!H1GgI)4d-cK>ddOM}5TN1N`auzGxauh#Wg6
z=NCfE4Gxj54jz=|=4y&{K--}k4l~HgjX?RmbC@!snWbZ?cDZ503t&ED1qa(HYN62E
zPulrYzAQo~I52`0cZOxj5;YH)f<mji7~L%id?nr~gR-%}H@2vx`?tjdrq^08gPeqb
zXqnJ{&X#wInTL^Cs7x@FwcfH8kK5^e=+b@p&OM*xLqGx=FQZhxeblLZY~6BQOEu1H
z^#j|yT~1|hxZ9T3TjAqmS4b+Z=}MBnJd-w2-kPEegy+jw8M2}|A5QV4PxcF=g%yn7
zMzdTM#^{r6|H$RL#7pp2=5)4!MgM)G9NgD(r3D)&>rFo*fO%?9lo^_ji0Z8|8!(G>
zd-3&~tn0D3q4UME&q3(^vs3G~N2yTf{vSC*4?tOD2dBj}Km`5H^utjI<3|uqt!|gA
zba1fXmK%!A9Q?(U8H%+OGQel0#S$TryF!Eu!L086>}u3!MUI;g`*D;ZSp7lz*MYwI
z^RLp8?SB;?d9mYK)36Hew-OK%ma!&g);<jr!)sSMG#8U(7#P*uKsi&||ASY`*<s--
zT2f4NefUl>8-fW!0baM%xuM@O*mem<+ncF@8WJP^st5*94bo-ysX!^GxnI&sT)$_#
zPdf-M;qKM!NYEE6O8<fo@}fhG`F5K4(J)gbvKNXWi)xsVfy`7gaFbEurOLW%uQIal
z+|$B-FNzLuIfb_*NPwGWKmC1ge`+@GXV#QKgj(T-cy`Y%<JaICka39u51vO8x<<Sa
z8gnFn-m7^d&5vF3FO(6eGh6VV9e($#ukL96d(ae3lRC%&xKS^`$QdCa0TA!I4SFRM
zi@nMCPd_$@oHKyt!;C1;i7rz;axbyb&*IhiIh`=tTI|m><E#3AV*$=Oa@@5!%};4S
zQ0^E*UJFE5d_i#eI~f}iV6!@M36@XbnU+qt&AmwM*PAX@Mf1c%lpxa9?lv2tGunTK
z(h0|ZR$I-#C3JES@4Yq#IJ8Y|c{$6@4yL`=$At0o$!pH-vH8MpLI^Ffw74ev%gvE$
z6*6)@<?AX+SBZRaF$Z~9tN9(%geMMG()q^GX(Rj|ar;!DK5GT^E(@25HI+=2%5Su)
z&Tq`EK{n=A7bLf=_s)^hjXiTN*cbc!I#*te%@iGTgL-YW2tHa)jEdL`6^m@Mv+wmU
zX2X(anjWljrAay+aHanUf%1Zqn5bp2w1-+rPzy3i^A02WB&!9#NKKxPg0=P_tXA>D
zByVr8F*-n7)x2+a1a*U5dqpE5y;4*>eP+RMHd2hpUg2oePXN<-iRjHl;kh%-*Gehv
zy-ClPSwMKeQYvPr>jo`?_!TBgxgG4-eL}}0PgX<WV0U}%;F?z{8=*sjV^of;JH3js
z+)h*l_RgV-T@RagW+p?VTi7R4p^QMwTz#)#etoHmXe`}oz7%Hqkn*>{QjhJ?<G!2N
z4?V(cC4~&5WSdrAVe5*<S5KM`Y4I-ZN87H<XM~bJnW>W4naphwGs|&kCG$!n>2{@G
z;n0lq0M&*zH$<`ng+IM6nQ%mzGeTz9iz=72`$-8$eLaJ)9Y)d%?U%n~nU66ag_f|I
z#LhxqEtie#^tKh#kYQ~faEzVMYG_w7i;TJY_4{_@R&aBk6{*$yB5gcNBeGN8@D=K~
z-ao`-`${oFM80pzZ=}PXh+Z}0K?eN~i*fY3pzgc@L8^StZeXpf0+RRa%8Xw+aoM*(
zcSm40_9!HzEJJ}I>!MwKwudr4cCY4QA@O=fDCQxUwAobWcmx9AEu3G^U*$}hK3px>
zZVcX2l<^ZH#MSptA-yMJe^B8YoRAjii+qmT0M*zG7?yT^=yONh;v@Y%oLCi|iShvI
z_2-GM^8B}4h`c@%)0#@`g}y+uY&`M9p%MR8B(Fu}dj%bPes;)0qX9OtMF%~*=y)_B
z$Qm4UZt#6`$nX$GTaVqFnEvaPJQb-szt3DCx;*UlE3oxVMuN3xVYGyh;<6~K>t9F?
zT2DrSFx+2N2y4nBg3*e2E}0A+f5?|c=b`|fnhAd)MqF%>hykUfbE{VDiruhG^R+|4
zF~%T-xrfu1F(VDR=Ch-F+k3&OgQ=5<qruu=vebGHH{3qwcc{u5sEeXQk1w>ZEam6V
zvK8@am-Pyq8op$FYF!5h9sOnw4`peJJ7Zmj4b3(TD=ZEbPg+u#9{l>`wV=MLWhV63
zA6jEG41VOu_rz?CMeT!Aqo8}3zuqe+cil0&ufQZlZ3VBuE3j9Y?B^MrzZf7zz*R1j
z1kfQNX{;RyY&Tj@sD@d0<6!2h#6ct3EPN@y2x<yZi2fdJJ~>l{Y^=qTC{(|U^j``s
zw5cxfX8i@dxw}H{k1-Y=xxh})3UHO!p3Cv~EfG08DG8~<`9HmB(1OSlmry=7q~B}_
zsUE3J68t&w=DljYKNY~2die>~%4_UadO67|6^>waYWCv4yo^g<!<QZS5D&U6o8cix
z=(8_>w$WK*Q)Lm0fBi~N8ze&e6i6Lm4rO+wf2Hk=Fi2+*u%mL91zgi;p@<%iIS`VK
zh8go|e;p}ejHe{RWdV<g@BFg%Z{ts|yI}DIY|r^j**pLJU<e_)f1iA;8oHO?<-ue^
zISL|NTyV9g)Q5JoAskV=rdGJV^rUI{_=-<z?-`2k>pg}lK7IroI3_$Bkro*?aj|{~
zsiHH7NkPv0@Up$eHmf-kHBBPqTYA5<8THJ|Plt^FIUZY!Vx*)pLYyMC^qz93N9Up=
zhZkQ^ffH@ZO$f`O)A@Uwd5(xlhdn=0=aZ5N>u7X7WK^iU54@)LhbxVt`wiuqH3dQR
zNC{zJ;4fnCjDX5(Id(6Rn`9%|;yp*_yqjZJRkh!2N;?lpmYkia<aVXfoa8czJs&pS
z4OojvJ*`hW39`8mE2a-(UkUwwAZYI43ZF5X93J*$-P@lh)5+f^em^3j=2s2*R`oud
zEU?AVK5a@NDF9t!`-#|V6eP-J<2eSffXC8dO}Xs{RGlnTd=eWs2#Qrqq~#$(q#`af
zD3A+zO6QUEO~YwauSPnCPCGWL_bsgul}aCPtkXWrwe(wI$A0M?B=4F6$;R#P3p@*8
zif3k$zZmc9<oNKc=`u%w&;UI*aau=)F9`*)3Ju$LK1?)Ai>kwij#V(+gTH)-sPu7^
zC3PjkBbo%9H%j|i-#gB}jZWH-o>%eSuda!Md(2t0eUpTd*_@u@%vKp^`tJ#B1>x`$
z9XG>+oZJb$7>Om7NPkP$Y}TB)ryHinqF2y|Phg&mQzSm2^|<hKn|R30obz5gw&azR
z%~W>y@QZluck3UuZ=+)MlOmdzHv~r~VraFky!R`YHivZFEfiCwKmwf8nE#4pMIYDX
z67B}SM}bcX!oAHi;s+T~8Wc0&K9({as35=7eh>6oidV-z-dokftv8vHK|#JP&)WL&
z?=r)w^=H`2Gyi%odD#R6?1ear&!&V)ZrN&}E;Fwss=VJZKTK8Yxl!2-u!CW=_+Y=x
zK5pBwd5*a*5?33qd~IZFj?o_KFL*vp!t6m5hbsrID3rz2nRs_L&z-l*uRjkh3lWV{
zmGdHFN}@R)5?*NhO)S7gF9T8tEv~4nS-J7nfpFWRS}i<n{6_5yS4afUpNVk*6Z01F
zVg$I?-JgYy4Q#N}UD@MuJrW=UvSlX<O#xJk*Iy*W@#%{Q%=-$rrh%T8IyqhKX<3<L
z05&W^PTBKXtz{2U%}<o9tj&HC5LiQYSpq;RpzSQ%_qF-_pyxrOTp6xXh-V|Qmjrsn
zVJq)5gB7QU<tt4sHdB}MPS^=|nGCGvHpq7g{V<IyfQM2JID^v-bO!x&xy09b2^(^(
z)|{+QuY6jcqth?*33Ce+?-x8tC{#dx15ppKhvYAFRinamt`f@?rx8zkC9O7TE%HC_
z;{TCUbuh*;57qrzx#udv45R!8c=L>Zx+7ua7QG>6I=+#xv~qXy5ah_Qt$o^NYplm%
zb9LJgsH_DkS1*B#V&PyGL{AEOULIiU``{i52|)&Md{;oS@82>PR;vR(<N1z~)qiUK
zL4RRzCMQM+Ey>^4k7Cco;@(E*yf_(}{--?vMD8uP{?4_mji0hY)PG4skcNYnGy73y
zAff7yz~#j}V#8Vo#;XNcFv~xufqy7PgENc$%qsuGkwA-e2i-Tors3W{!;I(0Vj=VT
zlUVW&Sako$PGHdgNk<}d$J+Vl^ja%$6x|)+pA+Xv<OuS?UGJSR(qjB`6hg=cPOOV2
zQM>)$%j3}x`lpc^8k<7*QbRXVQ?Dbp((E-x)Nr><x|zP`_qe#pbw1VgP$U#{w~dcu
zs@?T!gmOoDBirdu+0y}+z>SlrBZIgotA#2<|D5+%X35TfGo73AoAIk!m!+=~gE((E
zZcde<ol$4;b=evNexCij^^&p4#xLZ0K9sh;3NZ4=HSHX`9hDpx%VrE~Cx_lThdzkI
z%zerU6vv+@^6t_caK>1I4ffB?Q*(*dalFBYy}IC4(=F(-t~aJXD_z-N;RrH<iSOJM
z*Shvm2on5wVWi{vZWj;kXZZZE7tP_U+s`i8%hfW<lowXfV#fS9@IZZpXncGG3{t*Y
zMvFn00~|1~mXn>tT=S*wAKDp0s1^2U>`%yc{#DxP6jFU^_h*P3rtuQNkm-dud%~+t
zTR)F(U-g(1w!t1BFU0?BmOfg1*-v7nFr~c!FaQ-|@n^Q>5xzNB!+E}rCy(hqE$b^4
zo-ROwJ|f_#5wfv$#lw`n^co&E<^sZ=5LZthhVC;B2yRtM-<)Hu4rHpD1PrhcV@G-n
zzPKGzM{w%*o^9vHQ>=Eu)%c>pI@6Cdha`_O^#gRUZ!G&98ByI<P_@5g`@lMlj*hk`
zFuhv(DZLH!T*>l&JQCBUaw^8~j=&TuVACwiP!u=&xXWhyNw9CHOW<*gc+xBQr+FPQ
z+-9l2;mH4OT!+?(pm!a^|F3b~_g$9U`hT~HP!>AO?{Yj}`Iphq;OFUv_fKW@<;J-L
zMkCRA;Vm$>*Lk%v&wgXCf{wS*FoAjZ_(MRtV-BcvxRCC95hG1hj^n`v9-#MJeiVn1
zp^D#HKBb0?=YDHB-ieC?b$-spUaDZ3u!Y_$T9(x)&b7&qW4FK&NY2*^u!FHE`YjPo
zGuNX9J=|HOqq#aj>)AHwE^@v)tLk7BooPHa96qLMcmfD~>d-Ai(M_<8F3_#PK$D-q
zZA^rkYST6?;llo!A+FbPA>yo^%9KJ6>#cSdZa=eP%H74=oloe%1GhiltX>6s4w3j-
zeHf57@Pd4-b<jgqT!fJbzAVoIi1$9xl1}Kfg~r-6k~iYqo`=cx(Wk?Bj{HXl7C%Vw
z6Q2|%2bs_J+xTs7f_7Z9-npRjn>HX&*f6zQ>?}r8#qbXL<9;yU=TNLvMNYbyZ4%_t
z2l0J-#7JZ;Li=bns>`{P4iH0;GwmJSx|;l_XZ>T{bs}$cs<K5JYsp?h*r^Dg^|VmM
zT0tA1?DPCMmzDH|^O;5A<sHCN)yl4OIDNb<>#=fO@|X@wg5kE!%1Upzz=PDT%$#zT
z)od((Qq}^t>cjd^x5#I{tHa?{pwnHSw#V7Nl6IEEoOuQI`|`Nh->N$B;t9toc%y6k
zyvakXGF)tXev)TzsH}<yRG9lxWf7Kzh8+@AW}?^<XjOfq7`OPha1idiVYG#zTeno?
z<GS5I<Ft|xx91CydVIfqg+vI^L~#oOUtWE=`?f4W2u(nRN6j}}A<8)tFmz#(8oMA8
zNSFtDc?t~c7{%I~*Lq?$`cO1Qr30>=!5WVXB`%Nr)w#I(AF&KxUej}P7#P=w#9=R#
z9%ma_`q`KXnv|dW3sGRbRqu*woC4kVkVgyAs&j+6?fItyDjs!Ul=ouF(mpftZdTf@
z)X_up>2DCZXgV}`iig}E8P3<^&lh`c0^Y6=WPC^JMnAJjz@y-5A6sNZ$R$DHiazBG
zu=~0pz#)DR;W=nmhCLu4hMiClS9a##c7grueS<3U1G-Y|a3SlFe_2vzvVAYQ+ak;s
z^k<k-ffG-><E~K*+B@Ct8aid087VX>`CLG3F#YOGrLpOl*1glmnZL;jIcMXFosbt7
zD^#_d5?z^Tw0@LjOVo@`Ql^RZji3T8h8vSzp>-7?fV10Dg&4o`y#t<*1{2d#6Zj#f
z1!J(+ghS`)xh8CWj2$1lYz|^Vs&eqScBcD5L$tMmqJSq}kFyu=%7$pNeH9uW<Us85
zVYeBbm)guGFv{JG;ZWWM$}!_YN_Zf#f^xRH)vuWa6|C(zVb3h+^c}&pM^u1Y??dg<
z+?<Go%CmLFIEnI0<t3_gW4vQfRI`-eUx|}mdJ$InlBDDofHMiSdkEG`7sGH;RX~Gj
z{4iK;eL)<jGDHp+jKT<Iy^gpzHJaTmC%jM+#U2G3Y?S(kZv;IlQ6L}TFP~d9P+XM_
zrWto7;`xnUJOWoux9wjG8?iG#GD&3l@(17<_~h_D{I}wQ<72I=VnlS-_MZXE2PtT{
ze7;1ckzW?+uB*iDkW;YmI`{4CuKZ}q=bBHw^0JJmGZ>v-)V^P&Jalttx%%|8gEk(F
z7Tvt_IvxH6k*%txjmS#+={p4Aq_bP0j+^lg&L#P+tpvh}Wn8`@JK}pIiJ}Cma}y<i
za#ElriE2GvQi3dPt&e)FcePirX@uBf$p==mhsciGNs#vB{5jf!RC(?CR;|l2+-Wm-
zJRi9YAw1Y$o3wL-8l{+T_H1?K@TH-<k(vevHa~M~Vn$KfTo6IG$@V~3GV}3kwfW!B
zO+yFm&`m>;qC%@>{4ZGuD8L1I9j^n{?WYhc&}B-S2BOA!kMnOi`6l<OF|aavzk@5x
zsCjO1V`eW}cOkN@{^F6Eqnn0GmPztxs)Px3T#*v-x*xw!xwIT?BSPHm0ws?07#L9e
z2wX-L+^q7yV9ZN#{{YQSvb@%>fc;-RA%w0id#9@({+FKc6?%5P+0+A#%l*t(W&`Zt
z-=m{7=9g);u_G^F5Tfg;B-gVS#iaDfWsLbFFlD8$h|)@|KDV}pbBRF)jN;!7WxH}m
za~R=QNPuRLr-k_Si|!i!+gChB!yhm~|ESW_U;jsynkq{J#d{}y!srdn$y}c-OLt*8
z2=bw|GO6qCh#$>iNN!*&m<*s~VRe$HwTK6Y5E==3^!+8wv~(YGK14TV6(8Q=R<~bQ
zMz^v@DV%?234nNYX<S+h7ys8<Aa5T%{Oxul<zqp{w@U+p<$2)o0br2H5Tw-D@6A^f
z)o=|dUMn8b+3j5$DYOqVefYA6cbb~%FT2LqGxgJ@RU>;E@ZM^Nju&$w!r8&D6O5=}
z2wxTIJ{`1+C%Db6sogxPiwg{`!e~42K5|kt85-zfhdVQqg;uf@`DdRFCcbU1Enf&&
z%r*uTj#<@cF(=%L)LDo+GMtRMxWStJ{hhzy;YW`{zZ&(f9=IUK-!>bkn$w+ow>`FQ
zUTl$g6vq|EJuDixeV4iR63iXx%k&1G(`2r9XLMY)O+?6jZH<w%suGpY53Yb=8dgW4
zh$E!pqksQp)rq3c+E3ZL+PQbBmp-Z`*!=xC^)5yzBWETpSgJSbm4_gNB3L_rcshiz
zGhP6L{az^Nr@t4DC+^(+_-~JZlU67s|Iczl0~i)yjSYs^ydwJ_vNBBcSMbb${*_D%
z?CW?+EK`tAo}v7Y1&+3Qo`LhcqKU~Fu--D!p8R!oyc-rMrJCSDJ(zO&rvn%;y=`da
z=xNN-hyI{JS*k<sgTwuD^mF$vU6;Q-4jRmN>Rn0N!X@*Ws_6yaef!H{vG$w2eFD+P
z4#}qq=x)Y9-$?#B{iWD+AG4K45cJ{Q@@&$DAz0GP(kpM#kuOJ6!#+AS3BD{sq5t|k
z@o%ugGR3g>f9C2GN8PN>56-kuEb|&&E;EGeyIv6;9?T3v{*tUNj1Y8gpmtupf6|nx
z`oPa?(DOfkgaQUJT-L&ppc?&;yIy5K866~lnn1;@RyOn9Pf4?W+nbAbGLUj#gV#Ai
zat-CGnaglZ{mPTqS6p&e3uP`LHrhx4upRUzK`9E4wqFSmRjFhuDF&~^<P22dTe?~N
z`^jnNu-!NWACx~LgbZ+Jtbj7bfBc;PPzJq}5n4dgWS}P#%|>^NmgnF8%w7)&aVrS^
z@t6OeJ0b?4u<OLbBq9HLPqZ6o7rq*6uIBGWBgBXMp<U9i|35Jov`h31ZI%9f)Fw)V
zD~S0Qm_^6|7Q&Ng>#~Rcx@c{<*eA*m&f#79)&C4U96Uwu`MRz8e<U3Y?F$wys!sk>
z|LQCB0~<?O7Q!jlN2mAi)k4_7i@0$Wjhp}LHU@*vX7|#ULplES?xtzH)DM8qB6)mI
z<G)|+A^1L7uS0<||DX462P68)=USlk@0l6m@t^fTwjmMn)4vcNhy;8A<9r*V1mZIP
z7R?Izf<67oxIjPS@9zd!>->f0vx3F4fwcM`pA`b0Ph6KC1*Yoodh?$K;9k?fJI31>
zZ)X47xd3I26qr+MVPgAu$vppk{ubz}n4!Zk5cEIS*Mj)~aj#~=f3NqY_EO;gCdL{T
zGy3l*1wQwe+6x>EjEjq7YFif!42)}N6YmPf72=;B(RVef!4V8`5gAy{%Qx@;A8Qow
ANdN!<

literal 0
HcmV?d00001

diff --git a/docs/source/kv_cache/storage_backends/index.rst b/docs/source/kv_cache/storage_backends/index.rst
index b39521250d..fd20dca516 100644
--- a/docs/source/kv_cache/storage_backends/index.rst
+++ b/docs/source/kv_cache/storage_backends/index.rst
@@ -16,6 +16,7 @@ Supported Backends
    gds
    infinistore
    local_storage
+   maru
    mock
    mooncake
    nixl
diff --git a/docs/source/kv_cache/storage_backends/maru.rst b/docs/source/kv_cache/storage_backends/maru.rst
new file mode 100644
index 0000000000..9ee69d0006
--- /dev/null
+++ b/docs/source/kv_cache/storage_backends/maru.rst
@@ -0,0 +1,113 @@
+Maru
+====
+
+.. _maru-overview:
+
+Overview
+--------
+
+`Maru <https://github.com/xcena-dev/maru>`_ is a high-performance KV cache storage engine built on CXL shared memory,
+designed for LLM inference scenarios where multiple instances need to share a KV cache with minimal latency.
+
+.. image:: ../../assets/maru-kvcache.png
+    :alt: KV Cache Sharing: Without vs With Maru
+
+For architecture details, see the `Maru documentation <https://xcena-dev.github.io/maru/>`_.
+
+Quick Start
+-----------
+
+Install Maru:
+
+.. code-block:: bash
+
+    git clone https://github.com/xcena-dev/maru.git
+    cd maru
+    ./install.sh
+
+This installs ``maru-server``, ``maru-resourced``, and the ``maru`` Python package.
+
+Deploy Model With Maru
+~~~~~~~~~~~~~~~~~~~~~~
+
+**Prerequisites:** CXL device (``/dev/dax*``), Python 3.12+, vLLM and LMCache installed.
+
+**1. Start the Maru Server**
+
+.. code-block:: bash
+
+    maru-server
+
+**2. Create configuration file** (``maru-config.yaml``):
+
+.. code-block:: yaml
+
+    chunk_size: 256
+    local_cpu: False
+    max_local_cpu_size: 0
+    save_unfull_chunk: True
+
+    # Maru backend
+    maru_path: "maru://localhost:5555"
+    maru_pool_size: 4
+
+**3. Start vLLM with Maru**
+
+.. code-block:: bash
+
+    LMCACHE_CONFIG_FILE="maru-config.yaml" \
+    vllm serve \
+        meta-llama/Llama-3.1-8B-Instruct \
+        --max-model-len 65536 \
+        --kv-transfer-config \
+        '{"kv_connector":"LMCacheConnectorV1", "kv_role":"kv_both"}'
+
+Configuration
+-------------
+
+**LMCache Parameters:**
+
+.. list-table::
+   :header-rows: 1
+   :widths: 25 15 60
+
+   * - Parameter
+     - Default
+     - Description
+   * - ``maru_path``
+     - Required
+     - Maru server URL (format: ``maru://host:port``)
+   * - ``maru_pool_size``
+     - ``4.0``
+     - CXL memory pool size per instance in GB (e.g., ``4``, ``0.5``)
+
+**Advanced Parameters (via extra_config):**
+
+.. list-table::
+   :header-rows: 1
+   :widths: 25 15 60
+
+   * - Parameter
+     - Default
+     - Description
+   * - ``maru_instance_id``
+     - auto UUID
+     - Unique client instance identifier
+   * - ``maru_timeout_ms``
+     - 5000
+     - ZMQ RPC socket timeout in milliseconds
+   * - ``maru_use_async_rpc``
+     - true
+     - Async DEALER-ROUTER RPC (``false`` for synchronous REQ-REP)
+   * - ``maru_max_inflight``
+     - 64
+     - Max concurrent async RPC requests
+   * - ``maru_eager_map``
+     - true
+     - Pre-map all shared regions on connect
+
+Additional Resources
+--------------------
+
+- `Maru GitHub Repository <https://github.com/xcena-dev/maru>`_
+- `Maru Documentation <https://xcena-dev.github.io/maru/>`_
diff --git a/lmcache/v1/config.py b/lmcache/v1/config.py
index c6c86e563d..20bbc19276 100644
--- a/lmcache/v1/config.py
+++ b/lmcache/v1/config.py
@@ -236,6 +236,13 @@
         "default": None,
         "env_converter": int,
     },
+    # Maru CXL shared memory backend
+    "maru_path": {"type": Optional[str], "default": None, "env_converter": str},
+    "maru_pool_size": {
+        "type": float,
+        "default": 4.0,
+        "env_converter": float,
+    },
     # Other configurations
     # (Deprecated) The url of the actual remote lmcache instance for auditing.
     # Please use extra_config['audit_actual_remote_url'] instead.
diff --git a/lmcache/v1/storage_backend/__init__.py b/lmcache/v1/storage_backend/__init__.py
index b7212b9603..d49cda695a 100644
--- a/lmcache/v1/storage_backend/__init__.py
+++ b/lmcache/v1/storage_backend/__init__.py
@@ -218,6 +218,20 @@ def CreateStorageBackends(
         )
         storage_backends[str(gds_backend)] = gds_backend
 
+    if config.maru_path is not None and "MaruBackend" not in _skip:
+        try:
+            # First Party
+            from lmcache.v1.storage_backend.maru_backend import MaruBackend
+        except ImportError as e:
+            raise ImportError(
+                "The 'maru' and 'maru_lmcache' packages are required "
+                "to use MaruBackend. Please install them according to "
+                "the Maru setup documentation."
+            ) from e
+
+        maru_backend = MaruBackend(config, metadata, loop, dst_device)
+        storage_backends[str(maru_backend)] = maru_backend
+
     if config.remote_url is not None and "RemoteBackend" not in _skip:
         assert local_cpu_backend is not None, (
             "Remote backend requires local CPU backend as a buffer."
diff --git a/lmcache/v1/storage_backend/maru_backend.py b/lmcache/v1/storage_backend/maru_backend.py
new file mode 100644
index 0000000000..5069e071eb
--- /dev/null
+++ b/lmcache/v1/storage_backend/maru_backend.py
@@ -0,0 +1,734 @@
+# SPDX-License-Identifier: Apache-2.0
+
+# Standard
+from concurrent.futures import Future
+from typing import Any, Callable, List, Optional, Sequence, Union
+import asyncio
+import threading
+import time
+
+# Third Party
+from maru import MaruConfig, MaruHandler
+from maru_lmcache import CxlMemoryAdapter
+import torch
+
+# First Party
+from lmcache.integration.vllm.utils import get_size_bytes
+from lmcache.logging import init_logger
+from lmcache.utils import CacheEngineKey
+from lmcache.v1.config import LMCacheEngineConfig
+from lmcache.v1.memory_management import (
+    MemoryAllocatorInterface,
+    MemoryFormat,
+    MemoryObj,
+)
+from lmcache.v1.metadata import LMCacheMetadata
+from lmcache.v1.storage_backend.abstract_backend import AllocatorBackendInterface
+
+logger = init_logger(__name__)
+
+
+class MaruBackend(AllocatorBackendInterface):
+    """Maru CXL shared memory storage backend.
+
+    Implements AllocatorBackendInterface with its own CxlMemoryAdapter.
+    No LocalCPUBackend needed — data lives directly in CXL mmap memory.
+
+    Put is async (Future): metadata registration via RPC.
+    Get is sync: CXL memory direct read (no network I/O).
+
+    Args:
+        config: LMCache engine configuration. Must have maru_path set.
+        metadata: LMCache engine metadata.
+        loop: asyncio event loop for async put tasks.
+        dst_device: Target device string (unused for CXL, kept for interface).
+    """
+
+    def __init__(
+        self,
+        config: LMCacheEngineConfig,
+        metadata: LMCacheMetadata,
+        loop: asyncio.AbstractEventLoop,
+        dst_device: str = "cuda",
+    ):
+        super().__init__(dst_device=dst_device)
+
+        if config.use_layerwise:
+            raise NotImplementedError(
+                "MaruBackend does not yet support layerwise KV cache."
+            )
+
+        # 1. Config
+        self.config = config
+        self.loop = loop
+
+        self._full_chunk_size_bytes: int = get_size_bytes(
+            metadata.get_shapes(), metadata.get_dtypes()
+        )
+        assert self._full_chunk_size_bytes % metadata.chunk_size == 0
+        self._single_token_size: int = (
+            self._full_chunk_size_bytes // metadata.chunk_size
+        )
+
+        self._mla_worker_id_as0_mode: bool = (
+            config.get_extra_config_value(
+                "remote_enable_mla_worker_id_as0", metadata.use_mla
+            )
+            and metadata.use_mla
+            and metadata.world_size > 1
+            and metadata.worker_id != 0
+        )
+
+        # 2. Handler
+        self._handler = self._create_handler(config)
+
+        # 3. Allocator
+        self.memory_allocator = self.initialize_allocator(config, metadata)
+
+        # 4. State
+        self.put_lock = threading.Lock()
+        self.put_tasks: set[CacheEngineKey] = set()
+
+    def __str__(self) -> str:
+        return self.__class__.__name__
+
+    @staticmethod
+    def _pool_size_gb_to_bytes(size_gb: float) -> int:
+        """Convert pool size in GB to bytes."""
+        return int(size_gb * 1024**3)
+
+    # =========================================================================
+    # Initialization helpers
+    # =========================================================================
+
+    def _create_handler(
+        self,
+        config: LMCacheEngineConfig,
+    ) -> "MaruHandler":
+        """Create and connect a MaruHandler.
+
+        Args:
+            config: LMCache engine configuration.
+
+        Returns:
+            Connected MaruHandler instance.
+
+        Raises:
+            RuntimeError: If MaruHandler connection fails.
+        """
+        assert config.maru_path is not None, "maru_path must be set for MaruBackend"
+
+        # Convert maru:// scheme to tcp:// for ZMQ
+        server_url = config.maru_path
+        if server_url.startswith("maru://"):
+            server_url = "tcp://" + server_url[len("maru://") :]
+
+        extra = config.extra_config or {}
+        maru_config = MaruConfig(
+            server_url=server_url,
+            instance_id=extra.get("maru_instance_id"),
+            pool_size=self._pool_size_gb_to_bytes(config.maru_pool_size),
+            chunk_size_bytes=self._full_chunk_size_bytes,
+            auto_connect=False,
+            timeout_ms=extra.get("maru_timeout_ms", 5000),
+            use_async_rpc=extra.get("maru_use_async_rpc", True),
+            max_inflight=extra.get("maru_max_inflight", 64),
+            eager_map=extra.get("maru_eager_map", True),
+        )
+
+        handler = MaruHandler(maru_config)
+        if not handler.connect():
+            raise RuntimeError(f"Failed to connect MaruHandler to {config.maru_path}")
+        logger.debug("[Maru] Connected to %s", config.maru_path)
+        return handler
+
+    # =========================================================================
+    # AllocatorBackendInterface
+    # =========================================================================
+
+    def initialize_allocator(
+        self, config: LMCacheEngineConfig, metadata: LMCacheMetadata
+    ) -> MemoryAllocatorInterface:
+        """Create CxlMemoryAdapter backed by the connected handler.
+
+        Args:
+            config: LMCache engine configuration.
+            metadata: LMCache engine metadata.
+
+        Returns:
+            CxlMemoryAdapter instance.
+        """
+        shapes = metadata.get_shapes()
+        dtypes = metadata.get_dtypes()
+        fmt = MemoryFormat.KV_MLA_FMT if metadata.use_mla else MemoryFormat.KV_2LTD
+        chunk_size = self._handler.get_chunk_size()
+
+        return CxlMemoryAdapter(
+            handler=self._handler,
+            shapes=shapes,
+            dtypes=dtypes,
+            fmt=fmt,
+            chunk_size=chunk_size,
+        )
+
+    def get_memory_allocator(self) -> MemoryAllocatorInterface:
+        """Returns the underlying CxlMemoryAdapter."""
+        return self.memory_allocator
+
+    def get_allocator_backend(self) -> "MaruBackend":
+        """Returns self as the allocator backend."""
+        return self
+
+    def allocate(
+        self,
+        shapes: Union[torch.Size, list[torch.Size]],
+        dtypes: Union[torch.dtype, list[torch.dtype]],
+        fmt: MemoryFormat = MemoryFormat.KV_2LTD,
+        eviction: bool = True,
+        busy_loop: bool = True,
+    ) -> Optional[MemoryObj]:
+        """Allocate CXL-backed memory via CxlMemoryAdapter.
+
+        Args:
+            shapes: Tensor shape(s).
+            dtypes: Tensor dtype(s).
+            fmt: Memory format.
+            eviction: Unused.
+            busy_loop: Unused.
+
+        Returns:
+            MemoryObj backed by CXL memory, or None on failure.
+        """
+        obj = self.memory_allocator.allocate(shapes, dtypes, fmt)
+        if obj is not None:
+            logger.debug(
+                "[Maru] allocate rid=%d pid=%d",
+                *CxlMemoryAdapter.decode_address(obj.metadata.address),
+            )
+        else:
+            logger.debug("[Maru] allocate failed shapes=%s dtypes=%s", shapes, dtypes)
+        return obj
+
+    def batched_allocate(
+        self,
+        shapes: Union[torch.Size, list[torch.Size]],
+        dtypes: Union[torch.dtype, list[torch.dtype]],
+        batch_size: int,
+        fmt: MemoryFormat = MemoryFormat.KV_2LTD,
+        eviction: bool = True,
+        busy_loop: bool = True,
+    ) -> Optional[list[MemoryObj]]:
+        """Allocate multiple CXL-backed MemoryObjs.
+
+        Args:
+            shapes: Tensor shape(s) (same for each allocation).
+            dtypes: Tensor dtype(s) (same for each allocation).
+            batch_size: Number of allocations.
+            fmt: Memory format.
+            eviction: Unused.
+            busy_loop: Unused.
+
+        Returns:
+            List of MemoryObj, or None if any allocation fails.
+        """
+        return self.memory_allocator.batched_allocate(shapes, dtypes, batch_size, fmt)
+
+    # =========================================================================
+    # Put (async)
+    # =========================================================================
+
+    def exists_in_put_tasks(self, key: CacheEngineKey) -> bool:
+        """Check whether key is in ongoing put tasks.
+
+        Args:
+            key: The cache key.
+
+        Returns:
+            True if the key has a pending put task.
+        """
+        with self.put_lock:
+            return key in self.put_tasks
+
+    @staticmethod
+    def _create_immediate_empty_future() -> Future:
+        """Create a Future that is already resolved with None."""
+        f: Future = Future()
+        f.set_result(None)
+        return f
+
+    def submit_put_task(
+        self,
+        key: CacheEngineKey,
+        memory_obj: MemoryObj,
+        on_complete_callback: Optional[Callable[[CacheEngineKey], None]] = None,
+    ) -> Future:
+        """Submit a put task to register KV metadata with MaruServer.
+
+        Data is already in CXL memory (zero-copy). This only registers
+        the key -> location metadata via RPC.
+
+        Args:
+            key: The cache key.
+            memory_obj: MemoryObj with data already written to CXL.
+            on_complete_callback: Optional callback after registration.
+
+        Returns:
+            Future that completes when metadata is registered.
+        """
+        # If MLA worker id as 0 mode is enabled, skip put tasks
+        if self._mla_worker_id_as0_mode:
+            return self._create_immediate_empty_future()
+
+        assert memory_obj.tensor is not None
+
+        # Keep CXL page alive: ref_count_down is only called on failure.
+        # On success the ref is retained so the CXL memory is not reclaimed.
+        memory_obj.ref_count_up()
+
+        with self.put_lock:
+            self.put_tasks.add(key)
+
+        future = asyncio.run_coroutine_threadsafe(
+            self._async_store(key, memory_obj, on_complete_callback),
+            self.loop,
+        )
+        return future
+
+    def batched_submit_put_task(
+        self,
+        keys: Sequence[CacheEngineKey],
+        memory_objs: List[MemoryObj],
+        transfer_spec: Any = None,
+        on_complete_callback: Optional[Callable[[CacheEngineKey], None]] = None,
+    ) -> Union[List[Future], None]:
+        """Submit batched put tasks via single batch_store RPC.
+
+        Args:
+            keys: The cache keys.
+            memory_objs: MemoryObjs with data already in CXL.
+            transfer_spec: Unused.
+            on_complete_callback: Optional per-key callback.
+
+        Returns:
+            List containing a single Future for the entire batch.
+        """
+        # If MLA worker id as 0 mode is enabled, skip put tasks
+        if self._mla_worker_id_as0_mode:
+            return None
+
+        for memory_obj in memory_objs:
+            assert memory_obj.tensor is not None
+            memory_obj.ref_count_up()
+
+        with self.put_lock:
+            self.put_tasks.update(keys)
+
+        future = asyncio.run_coroutine_threadsafe(
+            self._async_batch_store(list(keys), memory_objs, on_complete_callback),
+            self.loop,
+        )
+        return [future]
+
+    async def _async_store(
+        self,
+        key: CacheEngineKey,
+        memory_obj: MemoryObj,
+        on_complete_callback: Optional[Callable[[CacheEngineKey], None]] = None,
+    ) -> None:
+        """Register KV metadata with MaruServer (runs in event loop).
+
+        Uses CxlMemoryAdapter.create_store_handle() to extract
+        (region_id, page_index) from the MemoryObj's encoded address.
+
+        Args:
+            key: The cache key.
+            memory_obj: MemoryObj backed by CXL memory.
+            on_complete_callback: Optional callback after registration.
+        """
+        success = False
+        try:
+            allocator = self.memory_allocator
+            assert isinstance(allocator, CxlMemoryAdapter)
+            handle = allocator.create_store_handle(memory_obj)
+            key_str = key.to_string()
+
+            success = await asyncio.to_thread(self._handler.store, key_str, handle)
+
+            logger.debug(
+                "[Maru] store key=%s rid=%d pid=%d",
+                key,
+                handle.region_id,
+                handle.page_index,
+            )
+
+        except Exception as e:
+            logger.error("[Maru] store failed key=%s: %s", key, e)
+            raise
+        finally:
+            with self.put_lock:
+                self.put_tasks.discard(key)
+
+            if not success:
+                memory_obj.ref_count_down()
+
+            if success and on_complete_callback is not None:
+                try:
+                    on_complete_callback(key)
+                except Exception as e:
+                    logger.warning("on_complete_callback failed for key %s: %s", key, e)
+
+    async def _async_batch_store(
+        self,
+        keys: List[CacheEngineKey],
+        memory_objs: List[MemoryObj],
+        on_complete_callback: Optional[Callable[[CacheEngineKey], None]] = None,
+    ) -> None:
+        """Register multiple KV metadata entries via single batch_store RPC."""
+        results: Optional[list[bool]] = None
+        try:
+            allocator = self.memory_allocator
+            assert isinstance(allocator, CxlMemoryAdapter)
+
+            key_strs = [k.to_string() for k in keys]
+            handles = [allocator.create_store_handle(m) for m in memory_objs]
+
+            results = await asyncio.to_thread(
+                self._handler.batch_store, key_strs, handles
+            )
+            if results is not None:
+                logger.debug("[Maru] batch_store %d/%d ok", sum(results), len(results))
+        except Exception as e:
+            logger.error("[Maru] batch_store failed: %s", e)
+            raise
+        finally:
+            with self.put_lock:
+                self.put_tasks.difference_update(keys)
+
+            # Release ref_count for failed stores
+            for i, memory_obj in enumerate(memory_objs):
+                succeeded = results is not None and i < len(results) and results[i]
+                if not succeeded:
+                    memory_obj.ref_count_down()
+
+            if on_complete_callback is not None:
+                for i, key in enumerate(keys):
+                    if results is not None and i < len(results) and results[i]:
+                        try:
+                            on_complete_callback(key)
+                        except Exception as e:
+                            logger.warning(
+                                "on_complete_callback failed for key %s: %s",
+                                key,
+                                e,
+                            )
+
+    # =========================================================================
+    # Get (sync)
+    # =========================================================================
+
+    def get_blocking(
+        self,
+        key: CacheEngineKey,
+    ) -> Optional[MemoryObj]:
+        """Blocking get: read KV cache directly from CXL memory.
+
+        Queries MaruServer for metadata, then returns a MemoryObj
+        via CxlMemoryAdapter.get_by_location().
+
+        Args:
+            key: The cache key.
+
+        Returns:
+            MemoryObj backed by CXL memory, or None if not found.
+        """
+        if self._mla_worker_id_as0_mode:
+            key = key.with_new_worker_id(0)
+
+        key_str = key.to_string()
+        mem_info = self._handler.retrieve(key_str)
+        if mem_info is None:
+            logger.debug("[Maru] get_blocking miss key=%s", key)
+            return None
+
+        allocator = self.memory_allocator
+        assert isinstance(allocator, CxlMemoryAdapter)
+
+        memory_obj = allocator.get_by_location(
+            region_id=mem_info.region_id,
+            page_index=mem_info.page_index,
+            actual_size=len(mem_info.view),
+            single_token_size=self._single_token_size,
+        )
+        if memory_obj is None:
+            logger.debug(
+                "[Maru] get_blocking pool miss rid=%d pid=%d",
+                mem_info.region_id,
+                mem_info.page_index,
+            )
+            return None
+
+        memory_obj.ref_count_up()
+
+        logger.debug(
+            "[Maru] get_blocking rid=%d pid=%d size=%d",
+            mem_info.region_id,
+            mem_info.page_index,
+            len(mem_info.view),
+        )
+        return memory_obj
+
+    def batched_get_blocking(
+        self,
+        keys: List[CacheEngineKey],
+    ) -> List[Optional[MemoryObj]]:
+        """Blocking batched get via single batch_retrieve RPC.
+
+        Args:
+            keys: The cache keys.
+
+        Returns:
+            List of MemoryObj (None for misses).
+        """
+        if self._mla_worker_id_as0_mode:
+            keys = [k.with_new_worker_id(0) for k in keys]
+
+        key_strs = [k.to_string() for k in keys]
+        mem_infos = self._handler.batch_retrieve(key_strs)
+
+        allocator = self.memory_allocator
+        assert isinstance(allocator, CxlMemoryAdapter)
+
+        results: List[Optional[MemoryObj]] = []
+        for mem_info in mem_infos:
+            if mem_info is None:
+                results.append(None)
+                continue
+            memory_obj = allocator.get_by_location(
+                region_id=mem_info.region_id,
+                page_index=mem_info.page_index,
+                actual_size=len(mem_info.view),
+                single_token_size=self._single_token_size,
+            )
+            if memory_obj is None:
+                results.append(None)
+                continue
+            memory_obj.ref_count_up()
+            results.append(memory_obj)
+
+        hits = sum(1 for r in results if r is not None)
+        logger.debug("[Maru] batch_retrieve %d/%d hits", hits, len(results))
+        return results
+
+    # =========================================================================
+    # Async lookup API (used by StorageManager.async_lookup_and_prefetch)
+    # =========================================================================
+
+    async def batched_async_contains(
+        self,
+        lookup_id: str,
+        keys: List[CacheEngineKey],
+        pin: bool = False,
+    ) -> int:
+        """Check how many prefix keys exist via single batch_exists RPC.
+
+        Returns the count of contiguous keys starting from index 0
+        that exist. Stops at first miss.
+
+        Args:
+            lookup_id: Unique request identifier.
+            keys: Keys to check in prefix order.
+            pin: If True, atomically check and pin via batch_pin RPC.
+
+        Returns:
+            Number of prefix-contiguous keys that exist.
+        """
+        return await asyncio.to_thread(self.batched_contains, keys, pin)
+
+    async def batched_get_non_blocking(
+        self,
+        lookup_id: str,
+        keys: list[CacheEngineKey],
+        transfer_spec: Any = None,
+    ) -> list[MemoryObj]:
+        """Non-blocking batched get via single batch_retrieve RPC.
+
+        Uses handler.batch_retrieve() for a single RPC call, then
+        resolves each MemoryInfo to a MemoryObj via CxlMemoryAdapter.
+        Stops at first miss and returns the prefix.
+
+        Args:
+            lookup_id: Unique request identifier.
+            keys: Keys to retrieve (already confirmed by contains).
+            transfer_spec: Unused.
+
+        Returns:
+            List of MemoryObjs backed by CXL memory.
+        """
+
+        def _batch_get() -> list[MemoryObj]:
+            if self._mla_worker_id_as0_mode:
+                actual_keys = [k.with_new_worker_id(0) for k in keys]
+            else:
+                actual_keys = list(keys)
+
+            key_strs = [k.to_string() for k in actual_keys]
+            mem_infos = self._handler.batch_retrieve(key_strs)
+
+            allocator = self.memory_allocator
+            assert isinstance(allocator, CxlMemoryAdapter)
+
+            results: list[MemoryObj] = []
+            for mem_info in mem_infos:
+                if mem_info is None:
+                    break
+                memory_obj = allocator.get_by_location(
+                    region_id=mem_info.region_id,
+                    page_index=mem_info.page_index,
+                    actual_size=len(mem_info.view),
+                    single_token_size=self._single_token_size,
+                )
+                if memory_obj is None:
+                    break
+                memory_obj.ref_count_up()
+                memory_obj.pin()
+                results.append(memory_obj)
+
+            logger.debug(
+                "[Maru] batch_get_non_blocking %d/%d hits", len(results), len(keys)
+            )
+            return results
+
+        return await asyncio.to_thread(_batch_get)
+
+    # =========================================================================
+    # Contains / Pin / Unpin / Remove
+    # =========================================================================
+
+    def contains(self, key: CacheEngineKey, pin: bool = False) -> bool:
+        """Check if key exists on MaruServer.
+
+        Args:
+            key: The cache key.
+            pin: If True, atomically check existence and pin the entry
+                 to protect it from eviction.
+
+        Returns:
+            True if key exists.
+        """
+        if self._mla_worker_id_as0_mode:
+            key = key.with_new_worker_id(0)
+
+        key_str = key.to_string()
+        if pin:
+            return self._handler.pin(key_str)
+        return self._handler.exists(key_str)
+
+    def batched_contains(
+        self,
+        keys: List[CacheEngineKey],
+        pin: bool = False,
+    ) -> int:
+        """Check how many prefix keys exist via single batch_exists RPC.
+
+        Args:
+            keys: Keys to check in prefix order.
+            pin: If True, atomically check and pin via
+                 batch_pin RPC.
+
+        Returns:
+            Number of prefix-contiguous keys that exist.
+        """
+        if self._mla_worker_id_as0_mode:
+            keys = [k.with_new_worker_id(0) for k in keys]
+
+        key_strs = [k.to_string() for k in keys]
+        if pin:
+            results = self._handler.batch_pin(key_strs)
+        else:
+            results = self._handler.batch_exists(key_strs)
+        num_hit = 0
+        for exists in results:
+            if not exists:
+                break
+            num_hit += 1
+        return num_hit
+
+    def pin(self, key: CacheEngineKey) -> bool:
+        """Pin a key to prevent eviction on MaruServer.
+
+        Increments the server-side pin_count.
+
+        Args:
+            key: The cache key.
+
+        Returns:
+            True if pinned successfully.
+        """
+        if self._mla_worker_id_as0_mode:
+            key = key.with_new_worker_id(0)
+        return self._handler.pin(key.to_string())
+
+    def unpin(self, key: CacheEngineKey) -> bool:
+        """Unpin a key to allow eviction on MaruServer.
+
+        Decrements the server-side pin_count. When pin_count reaches 0,
+        the entry becomes eligible for eviction.
+
+        Args:
+            key: The cache key.
+
+        Returns:
+            True if unpinned successfully.
+        """
+        if self._mla_worker_id_as0_mode:
+            key = key.with_new_worker_id(0)
+        return self._handler.unpin(key.to_string())
+
+    def batched_unpin(self, keys: List[CacheEngineKey]) -> None:
+        """Batch-unpin keys via single RPC.
+
+        Decrements server-side pin_count for each key. When pin_count
+        reaches 0, the entry becomes eligible for eviction.
+
+        Args:
+            keys: The cache keys to unpin.
+        """
+        if not keys:
+            return
+        if self._mla_worker_id_as0_mode:
+            keys = [k.with_new_worker_id(0) for k in keys]
+        key_strs = [k.to_string() for k in keys]
+        self._handler.batch_unpin(key_strs)
+
+    def remove(self, key: CacheEngineKey, force: bool = True) -> bool:
+        """Remove a key from MaruServer.
+
+        Args:
+            key: The cache key.
+            force: Whether to force removal.
+
+        Returns:
+            True if removed successfully.
+        """
+        if self._mla_worker_id_as0_mode:
+            key = key.with_new_worker_id(0)
+        key_str = key.to_string()
+        result = self._handler.delete(key_str)
+        logger.debug("[Maru] remove key=%s success=%s", key, result)
+        return result
+
+    # =========================================================================
+    # Lifecycle
+    # =========================================================================
+
+    def close(self) -> None:
+        """Close the backend and underlying MaruHandler."""
+        while True:
+            with self.put_lock:
+                if not self.put_tasks:
+                    break
+            time.sleep(0.1)
+
+        self.memory_allocator.close()
+        self._handler.close()
+        logger.info("MaruBackend closed.")
diff --git a/lmcache/v1/storage_backend/storage_manager.py b/lmcache/v1/storage_backend/storage_manager.py
index 4ac7a4d6ce..e55ce860a6 100644
--- a/lmcache/v1/storage_backend/storage_manager.py
+++ b/lmcache/v1/storage_backend/storage_manager.py
@@ -314,6 +314,11 @@ def _get_allocator_backend(
     ) -> AllocatorBackendInterface:
         if self.enable_pd:
             allocator_backend = self.storage_backends["PDBackend"]
+        elif "MaruBackend" in self.storage_backends:
+            if "LocalCPUBackend" in self.storage_backends:
+                allocator_backend = self.storage_backends["LocalCPUBackend"]
+            else:
+                allocator_backend = self.storage_backends["MaruBackend"]
         else:
             allocator_backend = self.storage_backends["LocalCPUBackend"]
         assert isinstance(allocator_backend, AllocatorBackendInterface)
@@ -443,7 +448,7 @@ def get(
             memory_obj = backend.get_blocking(key)
             if memory_obj:
                 if (
-                    backend_name not in ["LocalCPUBackend", "PDBackend"]
+                    backend_name not in ["LocalCPUBackend", "PDBackend", "MaruBackend"]
                     and "LocalCPUBackend" in self.storage_backends
                 ):
                     local_cpu_backend = self.storage_backends["LocalCPUBackend"]
@@ -487,7 +492,7 @@ def batched_get(
                 # Align with single-key `get()` logic:
                 # auto-write remote data to local CPU cache
                 if (
-                    backend_name not in ["LocalCPUBackend", "PDBackend"]
+                    backend_name not in ["LocalCPUBackend", "PDBackend", "MaruBackend"]
                     and "LocalCPUBackend" in self.storage_backends
                     and None not in memory_objs
                 ):
diff --git a/tests/v1/storage_backend/test_maru_backend.py b/tests/v1/storage_backend/test_maru_backend.py
new file mode 100644
index 0000000000..94961e2a62
--- /dev/null
+++ b/tests/v1/storage_backend/test_maru_backend.py
@@ -0,0 +1,788 @@
+# SPDX-License-Identifier: Apache-2.0
+
+# Standard
+from unittest.mock import MagicMock, patch
+import asyncio
+import mmap
+import threading
+
+# Third Party
+import pytest
+import torch
+
+# First Party
+from lmcache.utils import CacheEngineKey
+from lmcache.v1.config import LMCacheEngineConfig
+from lmcache.v1.memory_management import MemoryFormat, TensorMemoryObj
+from lmcache.v1.pin_monitor import PinMonitor
+from lmcache.v1.storage_backend.abstract_backend import AllocatorBackendInterface
+from tests.v1.utils import (
+    check_method_signatures,
+    get_abstract_methods,
+    get_methods_implemented_in_class,
+)
+
+maru = pytest.importorskip("maru", reason="maru package not installed")
+maru_lmcache = pytest.importorskip(
+    "maru_lmcache", reason="maru_lmcache package not installed"
+)
+
+# Third Party
+from maru_handler.memory import AllocHandle  # noqa: E402
+from maru_handler.memory.types import MappedRegion, MemoryInfo  # noqa: E402
+from maru_lmcache.adapter import CxlMemoryAdapter  # noqa: E402
+
+# First Party
+from lmcache.v1.storage_backend.maru_backend import MaruBackend  # noqa: E402
+
+# =========================================================================
+# Constants
+# =========================================================================
+
+TEST_CHUNK_SIZE = 1024
+TEST_DTYPE = torch.float32
+TEST_SHAPE = torch.Size([256])  # 256 * 4B = 1024 bytes = chunk_size
+
+
+# =========================================================================
+# Helpers
+# =========================================================================
+
+
+def _make_mock_handler(pool_size=4096, chunk_size=TEST_CHUNK_SIZE):
+    """Create a mock MaruHandler with mmap-backed regions."""
+    handler = MagicMock()
+    handler._connected = True
+
+    region_id = 100
+    page_count = pool_size // chunk_size
+
+    mmap_obj = mmap.mmap(-1, pool_size)
+    mapped_region = MappedRegion(
+        region_id=region_id,
+        handle=MagicMock(region_id=region_id, length=pool_size),
+        size=pool_size,
+        _mmap_obj=mmap_obj,
+    )
+
+    handler.get_buffer_view.side_effect = lambda rid, offset, size: (
+        mapped_region.get_buffer_view(offset, size) if rid == region_id else None
+    )
+    handler.get_region_page_count.side_effect = lambda rid: (
+        page_count if rid == region_id else None
+    )
+    handler.get_owned_region_ids.return_value = [region_id]
+    handler.get_chunk_size.return_value = chunk_size
+
+    def mock_set_on_region_added(callback):
+        if callback is not None:
+            callback(region_id, page_count)
+
+    handler.set_on_region_added.side_effect = mock_set_on_region_added
+
+    page_counter = [0]
+
+    def mock_alloc(size):
+        idx = page_counter[0]
+        page_counter[0] += 1
+        buf = mapped_region.get_buffer_view(idx * chunk_size, size)
+        return AllocHandle(buf=buf, _region_id=region_id, _page_index=idx, _size=size)
+
+    handler.alloc.side_effect = mock_alloc
+    handler.free = MagicMock()
+    handler.connect.return_value = True
+    handler.close.return_value = None
+    handler.store.return_value = True
+    handler.batch_store.return_value = None
+    handler.retrieve.return_value = None
+    handler.batch_retrieve.return_value = []
+    handler.exists.return_value = False
+    handler.batch_exists.return_value = []
+    handler.delete.return_value = True
+    handler.pin.return_value = True
+    handler.unpin.return_value = True
+    handler.batch_pin.return_value = []
+    handler.batch_unpin.return_value = None
+
+    return handler
+
+
+def _make_cache_key(chunk_hash: int = 12345) -> CacheEngineKey:
+    """Create a CacheEngineKey for testing."""
+    return CacheEngineKey(
+        model_name="test-model",
+        world_size=1,
+        worker_id=0,
+        chunk_hash=chunk_hash,
+        dtype=torch.float32,
+    )
+
+
+def _make_memory_obj(adapter: CxlMemoryAdapter) -> TensorMemoryObj:
+    """Allocate a TensorMemoryObj from the adapter."""
+    obj = adapter.allocate(TEST_SHAPE, TEST_DTYPE)
+    assert obj is not None
+    return obj
+
+
+# =========================================================================
+# Fixtures
+# =========================================================================
+
+
+@pytest.fixture(autouse=True)
+def _init_pin_monitor():
+    """Initialize PinMonitor singleton required by TensorMemoryObj.pin()."""
+    PinMonitor._instance = None
+    PinMonitor.GetOrCreate(LMCacheEngineConfig.from_defaults())
+    yield
+    PinMonitor._instance = None
+
+
+@pytest.fixture
+def async_loop():
+    """Provide an asyncio event loop running in a background thread."""
+    loop = asyncio.new_event_loop()
+    thread = threading.Thread(target=loop.run_forever, daemon=True)
+    thread.start()
+    yield loop
+    loop.call_soon_threadsafe(loop.stop)
+    thread.join(timeout=5)
+    loop.close()
+
+
+@pytest.fixture
+def mock_handler():
+    return _make_mock_handler()
+
+
+@pytest.fixture
+def adapter(mock_handler):
+    return CxlMemoryAdapter(
+        handler=mock_handler,
+        shapes=[TEST_SHAPE],
+        dtypes=[TEST_DTYPE],
+        fmt=MemoryFormat.KV_2LTD,
+        chunk_size=TEST_CHUNK_SIZE,
+    )
+
+
+@pytest.fixture
+def backend(mock_handler, adapter, async_loop):
+    """Create a MaruBackend with mocked internals."""
+    # Local
+
+    with patch.object(MaruBackend, "initialize_allocator", return_value=adapter):
+        backend = MaruBackend.__new__(MaruBackend)
+        backend.dst_device = "cpu"
+        backend.config = MagicMock()
+        backend.config.maru_pool_size = 4.0
+        backend.loop = async_loop
+        backend.memory_allocator = adapter
+        backend._handler = mock_handler
+
+        backend._full_chunk_size_bytes = TEST_CHUNK_SIZE
+        backend._single_token_size = TEST_CHUNK_SIZE // 256  # 4 bytes per token
+        backend._mla_worker_id_as0_mode = False
+
+        backend.put_lock = threading.Lock()
+        backend.put_tasks = set()
+    return backend
+
+
+def _run_async(loop, coro):
+    """Submit a coroutine to a running event loop and wait for result."""
+    future = asyncio.run_coroutine_threadsafe(coro, loop)
+    return future.result(timeout=5)
+
+
+# =========================================================================
+# Tests — Init & Interface Compliance
+# =========================================================================
+
+
+class TestMaruBackendInit:
+    def test_str(self, backend):
+        assert str(backend) == "MaruBackend"
+
+    def test_get_allocator_backend_returns_self(self, backend):
+        assert backend.get_allocator_backend() is backend
+
+    def test_get_memory_allocator_returns_adapter(self, backend, adapter):
+        assert backend.get_memory_allocator() is adapter
+
+
+class TestMaruBackendPoolSizeGbToBytes:
+    """Test _pool_size_gb_to_bytes static method."""
+
+    def test_4gb(self):
+        assert MaruBackend._pool_size_gb_to_bytes(4.0) == 4 * 1024**3
+
+    def test_half_gb(self):
+        assert MaruBackend._pool_size_gb_to_bytes(0.5) == 512 * 1024**2
+
+    def test_1gb(self):
+        assert MaruBackend._pool_size_gb_to_bytes(1.0) == 1024**3
+
+    def test_zero(self):
+        assert MaruBackend._pool_size_gb_to_bytes(0.0) == 0
+
+
+class TestMaruBackendInterfaceCompliance:
+    """Verify MaruBackend implements all required interface methods."""
+
+    def test_implements_all_abstract_methods(self):
+        abstract = get_abstract_methods(AllocatorBackendInterface)
+        implemented = get_methods_implemented_in_class(
+            MaruBackend, AllocatorBackendInterface
+        )
+        missing = abstract - implemented
+        assert not missing, f"Missing abstract methods: {missing}"
+
+    def test_method_signatures_match(self):
+        # Known: batched_submit_put_task uses 'memory_objs' instead of 'objs'
+        # TODO: Rename to 'objs' for full compliance
+        known_param_renames = {"batched_submit_put_task"}
+
+        mismatches = check_method_signatures(AllocatorBackendInterface, MaruBackend)
+        unexpected = [m for m in mismatches if m["method"] not in known_param_renames]
+        assert not unexpected, f"Signature mismatches: {unexpected}"
+
+
+# =========================================================================
+# Tests — Allocate
+# =========================================================================
+
+
+class TestMaruBackendAllocate:
+    def test_allocate_returns_memory_obj(self, backend):
+        obj = backend.allocate(TEST_SHAPE, TEST_DTYPE)
+        assert obj is not None
+        assert obj.tensor is not None
+        assert obj.metadata.dtype == TEST_DTYPE
+
+    def test_batched_allocate_returns_list(self, backend):
+        objs = backend.batched_allocate(TEST_SHAPE, TEST_DTYPE, batch_size=3)
+        assert objs is not None
+        assert len(objs) == 3
+        for obj in objs:
+            assert obj.tensor is not None
+
+
+# =========================================================================
+# Tests — Put (async)
+# =========================================================================
+
+
+class TestMaruBackendPut:
+    def test_submit_put_task_returns_future(self, backend, adapter):
+        obj = _make_memory_obj(adapter)
+        obj.parent_allocator = None
+        key = _make_cache_key()
+
+        future = backend.submit_put_task(key, obj)
+        assert future is not None
+        future.result(timeout=5)
+
+        backend._handler.store.assert_called_once()
+
+    def test_submit_put_task_tracks_in_flight(self, backend, adapter):
+        obj = _make_memory_obj(adapter)
+        obj.parent_allocator = None
+        key = _make_cache_key()
+
+        assert not backend.exists_in_put_tasks(key)
+
+        future = backend.submit_put_task(key, obj)
+        future.result(timeout=5)
+
+        # After completion, key should be removed from put_tasks
+        assert not backend.exists_in_put_tasks(key)
+
+    def test_exists_in_put_tasks_true_during_store(self, backend, adapter):
+        """Verify exists_in_put_tasks returns True while store is in progress."""
+        obj = _make_memory_obj(adapter)
+        obj.parent_allocator = None
+        key = _make_cache_key()
+
+        store_entered = threading.Event()
+        store_proceed = threading.Event()
+
+        def blocking_store(*args, **kwargs):
+            store_entered.set()
+            store_proceed.wait(timeout=5)
+            return True
+
+        backend._handler.store.side_effect = blocking_store
+
+        future = backend.submit_put_task(key, obj)
+
+        # Wait until store is actually running
+        assert store_entered.wait(timeout=5)
+        assert backend.exists_in_put_tasks(key)
+
+        # Let store complete
+        store_proceed.set()
+        future.result(timeout=5)
+        assert not backend.exists_in_put_tasks(key)
+
+    def test_batched_submit_put_task(self, backend, adapter):
+        keys = [_make_cache_key(i) for i in range(3)]
+        objs = [_make_memory_obj(adapter) for _ in range(3)]
+        for obj in objs:
+            obj.parent_allocator = None
+
+        backend._handler.batch_store.return_value = [True, True, True]
+
+        futures = backend.batched_submit_put_task(keys, objs)
+        assert futures is not None
+
+        for future in futures:
+            future.result(timeout=5)
+
+        backend._handler.batch_store.assert_called_once()
+
+    def test_submit_put_calls_callback(self, backend, adapter):
+        obj = _make_memory_obj(adapter)
+        obj.parent_allocator = None
+        key = _make_cache_key()
+        callback_called = []
+
+        def callback(k):
+            callback_called.append(k)
+
+        future = backend.submit_put_task(key, obj, on_complete_callback=callback)
+        future.result(timeout=5)
+
+        assert len(callback_called) == 1
+        assert callback_called[0] == key
+
+    def test_batched_submit_put_calls_callback_per_key(self, backend, adapter):
+        keys = [_make_cache_key(i) for i in range(3)]
+        objs = [_make_memory_obj(adapter) for _ in range(3)]
+        for obj in objs:
+            obj.parent_allocator = None
+
+        backend._handler.batch_store.return_value = [True, True, True]
+        callback_keys = []
+
+        def callback(k):
+            callback_keys.append(k)
+
+        futures = backend.batched_submit_put_task(
+            keys, objs, on_complete_callback=callback
+        )
+        for future in futures:
+            future.result(timeout=5)
+
+        assert set(callback_keys) == set(keys)
+
+    def test_submit_put_task_skips_in_mla_mode(self, backend, adapter):
+        """In MLA worker_id_as0 mode, submit_put_task should skip store."""
+        backend._mla_worker_id_as0_mode = True
+        obj = _make_memory_obj(adapter)
+        obj.parent_allocator = None
+        key = _make_cache_key()
+
+        future = backend.submit_put_task(key, obj)
+        assert future.result(timeout=5) is None
+        backend._handler.store.assert_not_called()
+
+    def test_submit_put_task_refcount_down_on_failure(self, backend, adapter):
+        """On store failure, ref_count should return to pre-submit level."""
+        obj = _make_memory_obj(adapter)
+        obj.parent_allocator = None
+        key = _make_cache_key()
+        initial_ref = obj.get_ref_count()
+
+        backend._handler.store.side_effect = RuntimeError("store failed")
+
+        future = backend.submit_put_task(key, obj)
+        with pytest.raises(RuntimeError):
+            future.result(timeout=5)
+
+        assert obj.get_ref_count() == initial_ref
+        assert not backend.exists_in_put_tasks(key)
+
+    def test_batched_submit_put_task_refcount_down_on_failure(self, backend, adapter):
+        """On batch_store failure, ref_count should return to pre-submit level."""
+        keys = [_make_cache_key(i) for i in range(3)]
+        objs = [_make_memory_obj(adapter) for _ in range(3)]
+        for obj in objs:
+            obj.parent_allocator = None
+        initial_refs = [obj.get_ref_count() for obj in objs]
+
+        backend._handler.batch_store.side_effect = RuntimeError("batch failed")
+
+        futures = backend.batched_submit_put_task(keys, objs)
+        for future in futures:
+            with pytest.raises(RuntimeError):
+                future.result(timeout=5)
+
+        for obj, initial_ref in zip(objs, initial_refs, strict=False):
+            assert obj.get_ref_count() == initial_ref
+        for key in keys:
+            assert not backend.exists_in_put_tasks(key)
+
+    def test_batched_submit_put_task_skips_in_mla_mode(self, backend, adapter):
+        """In MLA worker_id_as0 mode, batched_submit_put_task should skip."""
+        backend._mla_worker_id_as0_mode = True
+        keys = [_make_cache_key(i) for i in range(3)]
+        objs = [_make_memory_obj(adapter) for _ in range(3)]
+        for obj in objs:
+            obj.parent_allocator = None
+
+        result = backend.batched_submit_put_task(keys, objs)
+        assert result is None
+        backend._handler.batch_store.assert_not_called()
+
+
+# =========================================================================
+# Tests — Get (sync)
+# =========================================================================
+
+
+class TestMaruBackendGet:
+    def test_get_blocking_hit(self, backend, adapter):
+        key = _make_cache_key()
+
+        data_size = TEST_CHUNK_SIZE
+        data = bytearray(data_size)
+        mock_info = MemoryInfo(
+            view=memoryview(data),
+            region_id=100,
+            page_index=0,
+        )
+        backend._handler.retrieve.return_value = mock_info
+
+        result = backend.get_blocking(key)
+        assert result is not None
+        backend._handler.retrieve.assert_called_once()
+
+    def test_get_blocking_miss(self, backend):
+        key = _make_cache_key()
+        backend._handler.retrieve.return_value = None
+
+        result = backend.get_blocking(key)
+        assert result is None
+
+    def test_get_blocking_ref_count_increases(self, backend, adapter):
+        """After get_blocking, the returned MemoryObj should have ref_count
+        incremented."""
+        # Pre-allocate so pool has page 0
+        _make_memory_obj(adapter)
+
+        key = _make_cache_key()
+        mock_info = MemoryInfo(
+            view=memoryview(bytearray(TEST_CHUNK_SIZE)),
+            region_id=100,
+            page_index=0,
+        )
+        backend._handler.retrieve.return_value = mock_info
+
+        result = backend.get_blocking(key)
+        assert result is not None
+        # Pool objects start with ref_count=1, get_blocking calls ref_count_up
+        assert result.get_ref_count() >= 2
+
+    def test_batched_get_blocking(self, backend, adapter):
+        """batched_get_blocking returns list of MemoryObj via batch_retrieve."""
+        objs = [_make_memory_obj(adapter) for _ in range(2)]
+        keys = [_make_cache_key(i) for i in range(2)]
+
+        infos = []
+        for obj in objs:
+            rid, pid = CxlMemoryAdapter.decode_address(obj.metadata.address)
+            infos.append(
+                MemoryInfo(
+                    view=memoryview(bytearray(TEST_CHUNK_SIZE)),
+                    region_id=rid,
+                    page_index=pid,
+                )
+            )
+        backend._handler.batch_retrieve.return_value = infos
+
+        results = backend.batched_get_blocking(keys)
+        assert len(results) == 2
+        for r in results:
+            assert r is not None
+
+    def test_batched_get_blocking_with_miss(self, backend, adapter):
+        """batched_get_blocking returns None for missing keys."""
+        obj = _make_memory_obj(adapter)
+        keys = [_make_cache_key(i) for i in range(2)]
+
+        rid, pid = CxlMemoryAdapter.decode_address(obj.metadata.address)
+        info = MemoryInfo(
+            view=memoryview(bytearray(TEST_CHUNK_SIZE)),
+            region_id=rid,
+            page_index=pid,
+        )
+        backend._handler.batch_retrieve.return_value = [info, None]
+
+        results = backend.batched_get_blocking(keys)
+        assert len(results) == 2
+        assert results[0] is not None
+        assert results[1] is None
+
+
+# =========================================================================
+# Tests — Contains
+# =========================================================================
+
+
+class TestMaruBackendContains:
+    def test_contains_true(self, backend):
+        key = _make_cache_key()
+        backend._handler.exists.return_value = True
+
+        assert backend.contains(key) is True
+        backend._handler.exists.assert_called_once_with(key.to_string())
+
+    def test_contains_false(self, backend):
+        key = _make_cache_key()
+        backend._handler.exists.return_value = False
+
+        assert backend.contains(key) is False
+
+    def test_batched_contains_all_hit(self, backend):
+        keys = [_make_cache_key(i) for i in range(3)]
+        backend._handler.batch_exists.return_value = [True, True, True]
+
+        result = backend.batched_contains(keys)
+        assert result == 3
+
+    def test_batched_contains_partial_prefix(self, backend):
+        keys = [_make_cache_key(i) for i in range(3)]
+        backend._handler.batch_exists.return_value = [True, True, False]
+
+        result = backend.batched_contains(keys)
+        assert result == 2
+
+    def test_batched_contains_first_miss(self, backend):
+        keys = [_make_cache_key(i) for i in range(3)]
+        backend._handler.batch_exists.return_value = [False, True, True]
+
+        result = backend.batched_contains(keys)
+        assert result == 0
+
+    def test_contains_with_pin(self, backend):
+        key = _make_cache_key()
+        backend._handler.pin.return_value = True
+
+        assert backend.contains(key, pin=True) is True
+        backend._handler.pin.assert_called_once_with(key.to_string())
+        backend._handler.exists.assert_not_called()
+
+    def test_contains_with_pin_false(self, backend):
+        key = _make_cache_key()
+        backend._handler.pin.return_value = False
+
+        assert backend.contains(key, pin=True) is False
+
+    def test_batched_contains_with_pin(self, backend):
+        keys = [_make_cache_key(i) for i in range(3)]
+        backend._handler.batch_pin.return_value = [True, True, True]
+
+        result = backend.batched_contains(keys, pin=True)
+        assert result == 3
+        backend._handler.batch_pin.assert_called_once_with(
+            [k.to_string() for k in keys]
+        )
+        backend._handler.batch_exists.assert_not_called()
+
+    def test_batched_contains_with_pin_partial(self, backend):
+        keys = [_make_cache_key(i) for i in range(3)]
+        backend._handler.batch_pin.return_value = [True, False, True]
+
+        result = backend.batched_contains(keys, pin=True)
+        assert result == 1
+
+    def test_batched_contains_empty(self, backend):
+        backend._handler.batch_exists.return_value = []
+        assert backend.batched_contains([]) == 0
+
+
+# =========================================================================
+# Tests — Async Lookup
+# =========================================================================
+
+
+class TestMaruBackendAsyncLookup:
+    def test_batched_async_contains_all_hit(self, backend, async_loop):
+        keys = [_make_cache_key(i) for i in range(3)]
+        backend._handler.batch_exists.return_value = [True, True, True]
+
+        result = _run_async(
+            async_loop, backend.batched_async_contains("lookup-1", keys)
+        )
+        assert result == 3
+
+    def test_batched_async_contains_partial_prefix(self, backend, async_loop):
+        keys = [_make_cache_key(i) for i in range(3)]
+        backend._handler.batch_exists.return_value = [True, False, True]
+
+        result = _run_async(
+            async_loop, backend.batched_async_contains("lookup-2", keys)
+        )
+        assert result == 1
+
+    def test_batched_async_contains_empty(self, backend, async_loop):
+        backend._handler.batch_exists.return_value = []
+        result = _run_async(async_loop, backend.batched_async_contains("lookup-3", []))
+        assert result == 0
+
+    def test_batched_get_non_blocking_all_hit(self, backend, adapter, async_loop):
+        keys = [_make_cache_key(i) for i in range(2)]
+
+        objs = [_make_memory_obj(adapter) for _ in range(2)]
+        infos = []
+        for obj in objs:
+            rid, pid = CxlMemoryAdapter.decode_address(obj.metadata.address)
+            infos.append(
+                MemoryInfo(
+                    view=memoryview(bytearray(TEST_CHUNK_SIZE)),
+                    region_id=rid,
+                    page_index=pid,
+                )
+            )
+        backend._handler.batch_retrieve.return_value = infos
+
+        results = _run_async(
+            async_loop, backend.batched_get_non_blocking("lookup-4", keys)
+        )
+        assert len(results) == 2
+        for obj in results:
+            assert obj is not None
+
+    def test_batched_get_non_blocking_prefix_stop_on_miss(
+        self, backend, adapter, async_loop
+    ):
+        """Second key is a miss -> only first returned (prefix semantics)."""
+        keys = [_make_cache_key(i) for i in range(3)]
+
+        obj = _make_memory_obj(adapter)
+        rid, pid = CxlMemoryAdapter.decode_address(obj.metadata.address)
+        info = MemoryInfo(
+            view=memoryview(bytearray(TEST_CHUNK_SIZE)),
+            region_id=rid,
+            page_index=pid,
+        )
+        # hit, miss, hit -> should return only [hit]
+        backend._handler.batch_retrieve.return_value = [info, None, info]
+
+        results = _run_async(
+            async_loop, backend.batched_get_non_blocking("lookup-5", keys)
+        )
+        assert len(results) == 1
+
+    def test_batched_get_non_blocking_empty(self, backend, async_loop):
+        backend._handler.batch_retrieve.return_value = []
+        results = _run_async(
+            async_loop, backend.batched_get_non_blocking("lookup-6", [])
+        )
+        assert results == []
+
+
+# =========================================================================
+# Tests — Pin / Unpin / Remove
+# =========================================================================
+
+
+class TestMaruBackendPinRemove:
+    def test_pin_delegates_to_handler(self, backend):
+        key = _make_cache_key()
+        backend._handler.pin.return_value = True
+
+        assert backend.pin(key) is True
+        backend._handler.pin.assert_called_once_with(key.to_string())
+
+    def test_pin_returns_false_on_failure(self, backend):
+        key = _make_cache_key()
+        backend._handler.pin.return_value = False
+
+        assert backend.pin(key) is False
+
+    def test_unpin_delegates_to_handler(self, backend):
+        key = _make_cache_key()
+        backend._handler.unpin.return_value = True
+
+        assert backend.unpin(key) is True
+        backend._handler.unpin.assert_called_once_with(key.to_string())
+
+    def test_unpin_returns_false_on_failure(self, backend):
+        key = _make_cache_key()
+        backend._handler.unpin.return_value = False
+
+        assert backend.unpin(key) is False
+
+    def test_batched_unpin(self, backend):
+        keys = [_make_cache_key(i) for i in range(3)]
+
+        backend.batched_unpin(keys)
+        backend._handler.batch_unpin.assert_called_once_with(
+            [k.to_string() for k in keys]
+        )
+
+    def test_batched_unpin_empty(self, backend):
+        backend.batched_unpin([])
+        backend._handler.batch_unpin.assert_not_called()
+
+    def test_remove_existing_key(self, backend):
+        key = _make_cache_key()
+        backend._handler.delete.return_value = True
+
+        result = backend.remove(key)
+        assert result is True
+        backend._handler.delete.assert_called_once_with(key.to_string())
+
+    def test_remove_nonexistent_key(self, backend):
+        key = _make_cache_key()
+        backend._handler.delete.return_value = False
+
+        result = backend.remove(key)
+        assert result is False
+
+
+# =========================================================================
+# Tests — Lifecycle
+# =========================================================================
+
+
+class TestMaruBackendLifecycle:
+    def test_close_calls_handler_and_allocator(self, backend):
+        backend.memory_allocator = MagicMock()
+        backend.close()
+        backend.memory_allocator.close.assert_called_once()
+        backend._handler.close.assert_called_once()
+
+    def test_close_drains_pending_put_tasks(self, backend, adapter):
+        """close() should wait for in-flight put tasks to complete."""
+        obj = _make_memory_obj(adapter)
+        obj.parent_allocator = None
+        key = _make_cache_key()
+
+        # Submit a real put task that will complete via the event loop
+        future = backend.submit_put_task(key, obj)
+        future.result(timeout=5)
+
+        # After drain, close should succeed
+        backend.close()
+        backend._handler.close.assert_called_once()
+
+
+# =========================================================================
+# Tests — Store Handle Roundtrip
+# =========================================================================
+
+
+class TestMaruBackendStoreHandle:
+    def test_store_handle_roundtrip(self, backend, adapter):
+        """AllocHandle from create_store_handle should match original."""
+        obj = _make_memory_obj(adapter)
+        obj.parent_allocator = None
+
+        handle = adapter.create_store_handle(obj)
+        assert handle.region_id == 100
+        assert handle.page_index == 0
+        assert handle._size == obj.metadata.phy_size

From ba3ba51bcd67e6f7f47698c100b6c3c4ab09355f Mon Sep 17 00:00:00 2001
From: maobaolong <baoloongmao@tencent.com>
Date: Fri, 3 Apr 2026 14:18:14 +0800
Subject: [PATCH 04/10] [MP] Fix UT after merge #2851 (#2931)

Fix UT after merge #2851

Signed-off-by: baoloongmao <baoloongmao@tencent.com>
---
 tests/v1/distributed/test_resp_l2_adapter_integration.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/tests/v1/distributed/test_resp_l2_adapter_integration.py b/tests/v1/distributed/test_resp_l2_adapter_integration.py
index 2d33a243b4..2bd60bcb0b 100644
--- a/tests/v1/distributed/test_resp_l2_adapter_integration.py
+++ b/tests/v1/distributed/test_resp_l2_adapter_integration.py
@@ -274,7 +274,7 @@ def test_factory_creates_adapter(self):
         """Verify the factory can create a RESP L2 adapter from config."""
         # First Party
         from lmcache.v1.distributed.l2_adapters import create_l2_adapter
-        from lmcache.v1.distributed.l2_adapters.native_connector_l2_adapter import (
+        from lmcache.v1.distributed.l2_adapters.resp_l2_adapter import (
             RESPL2AdapterConfig,
         )
 

From 45d4d3662a8ea697c44973ca4b0f69c05b219f6e Mon Sep 17 00:00:00 2001
From: Samuel Shen <slshen@tensormesh.ai>
Date: Fri, 3 Apr 2026 00:24:13 -0700
Subject: [PATCH 05/10] [Bugfix]: fix get_num_heads for MLA format (#2941)

MLA format (NL_X_NB_BS_HS) absorbs heads into the hidden dim,
so get_num_heads should return 1 instead of raising ValueError.
This was preventing all MLA models (e.g. DeepSeek-V2-Lite) from launching.
---
 lmcache/v1/gpu_connector/utils.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/lmcache/v1/gpu_connector/utils.py b/lmcache/v1/gpu_connector/utils.py
index c1930e04bb..c43ef9482a 100644
--- a/lmcache/v1/gpu_connector/utils.py
+++ b/lmcache/v1/gpu_connector/utils.py
@@ -561,7 +561,8 @@ def get_num_heads(kv_caches: Any, gpu_kv_format: "lmc_ops.GPUKVFormat") -> int:
         # HND: [..., NH, BS, HS] — num_heads at shape[2]
         return kv_caches[0].shape[2]
     elif gpu_kv_format == lmc_ops.GPUKVFormat.NL_X_NB_BS_HS:
-        raise ValueError(_ATTRIBUTE_NOT_EXIST_ERROR.format(format=gpu_kv_format))
+        # MLA: heads are absorbed into hidden dim, so num_heads = 1
+        return 1
     elif gpu_kv_format == lmc_ops.GPUKVFormat.TWO_X_NL_X_NBBS_NH_HS:
         return kv_caches[0][0].shape[1]
     elif gpu_kv_format == lmc_ops.GPUKVFormat.NL_X_NBBS_ONE_HS:

From ccaf38d3c0c6619862cf05ff6ca3e6ec236b6bbb Mon Sep 17 00:00:00 2001
From: maobaolong <baoloongmao@tencent.com>
Date: Fri, 3 Apr 2026 15:45:44 +0800
Subject: [PATCH 06/10] [MP] Introduce l2 mooncake adapter (#2911)

* Introduce l2 mooncake adapter

Signed-off-by: baoloongmao <baoloongmao@tencent.com>

* Remove extra files

Signed-off-by: baoloongmao <baoloongmao@tencent.com>

* Reduce redundant code with setup.py

Signed-off-by: baoloongmao <baoloongmao@tencent.com>

---------

Signed-off-by: baoloongmao <baoloongmao@tencent.com>
---
 csrc/storage_backends/mooncake/connector.cpp  |  74 +++
 csrc/storage_backends/mooncake/connector.h    |  53 ++
 csrc/storage_backends/mooncake/pybind.cpp     |  14 +
 docs/source/mp/l2_storage.rst                 |  70 +++
 .../l2_adapters/mooncake_store_l2_adapter.py  | 135 ++++++
 setup.py                                      |  57 +++
 .../test_mooncake_store_l2_adapter.py         | 457 ++++++++++++++++++
 7 files changed, 860 insertions(+)
 create mode 100644 csrc/storage_backends/mooncake/connector.cpp
 create mode 100644 csrc/storage_backends/mooncake/connector.h
 create mode 100644 csrc/storage_backends/mooncake/pybind.cpp
 create mode 100644 lmcache/v1/distributed/l2_adapters/mooncake_store_l2_adapter.py
 create mode 100644 tests/v1/distributed/test_mooncake_store_l2_adapter.py

diff --git a/csrc/storage_backends/mooncake/connector.cpp b/csrc/storage_backends/mooncake/connector.cpp
new file mode 100644
index 0000000000..6aaa92517a
--- /dev/null
+++ b/csrc/storage_backends/mooncake/connector.cpp
@@ -0,0 +1,74 @@
+// SPDX-License-Identifier: Apache-2.0
+
+#include "connector.h"
+
+#include <cstdint>
+#include <cstdio>
+#include <stdexcept>
+#include <string>
+
+namespace lmcache {
+namespace connector {
+
+MooncakeConnector::MooncakeConnector(ConfigDict config, int num_workers)
+    : ConnectorBase(num_workers), config_(std::move(config)) {
+  // Create a RealClient via the static factory.
+  client_ = mooncake::RealClient::create();
+  if (!client_) {
+    throw std::runtime_error("Failed to create mooncake RealClient");
+  }
+
+  // Forward the config dict to setup_internal().
+  mooncake::ConfigDict mc_config(config_.begin(), config_.end());
+  auto result = client_->setup_internal(mc_config);
+  if (!result.has_value()) {
+    throw std::runtime_error("Mooncake setup_internal failed");
+  }
+
+  start_workers();  // IMPORTANT: call at END of ctor
+}
+
+MooncakeConnector::~MooncakeConnector() {
+  close();
+  if (client_) {
+    client_->tearDownAll();
+    client_.reset();
+  }
+}
+
+WorkerMooncakeConn MooncakeConnector::create_connection() {
+  WorkerMooncakeConn conn;
+  conn.client = client_.get();
+  return conn;
+}
+
+void MooncakeConnector::do_single_get(WorkerMooncakeConn& conn,
+                                      const std::string& key, void* buf,
+                                      size_t len, size_t chunk_size) {
+  int64_t bytes_read = conn.client->get_into(key, buf, len);
+  if (bytes_read < 0) {
+    throw std::runtime_error("Mooncake get_into failed for key: " + key);
+  }
+}
+
+void MooncakeConnector::do_single_set(WorkerMooncakeConn& conn,
+                                      const std::string& key, const void* buf,
+                                      size_t len, size_t chunk_size) {
+  int rc = conn.client->put_from(key, const_cast<void*>(buf), len);
+  if (rc != 0) {
+    throw std::runtime_error("Mooncake put_from failed for key: " + key);
+  }
+}
+
+bool MooncakeConnector::do_single_exists(WorkerMooncakeConn& conn,
+                                         const std::string& key) {
+  // isExist returns: 1=exists, 0=not, -1=error
+  int result = conn.client->isExist(key);
+  if (result < 0) {
+    throw std::runtime_error("Mooncake isExist failed for key: " + key);
+  }
+  return result == 1;
+}
+
+}  // namespace connector
+}  // namespace lmcache
diff --git a/csrc/storage_backends/mooncake/connector.h b/csrc/storage_backends/mooncake/connector.h
new file mode 100644
index 0000000000..eb4a858b2c
--- /dev/null
+++ b/csrc/storage_backends/mooncake/connector.h
@@ -0,0 +1,53 @@
+// SPDX-License-Identifier: Apache-2.0
+#pragma once
+
+#include "../connector_base.h"
+#include "real_client.h"
+
+#include <memory>
+#include <mutex>
+#include <string>
+#include <unordered_map>
+#include <vector>
+
+namespace lmcache {
+namespace connector {
+
+// ConfigDict mirrors mooncake::ConfigDict
+// (std::unordered_map<std::string, std::string>).
+using ConfigDict = std::unordered_map<std::string, std::string>;
+
+// Per-worker connection state for the Mooncake connector.
+// Each worker holds a raw pointer to the shared
+// RealClient (owned by MooncakeConnector).
+struct WorkerMooncakeConn {
+  mooncake::RealClient* client{nullptr};
+};
+
+class MooncakeConnector : public ConnectorBase<WorkerMooncakeConn> {
+ public:
+  MooncakeConnector(ConfigDict config, int num_workers);
+  ~MooncakeConnector() override;
+
+ protected:
+  WorkerMooncakeConn create_connection() override;
+
+  void do_single_get(WorkerMooncakeConn& conn, const std::string& key,
+                     void* buf, size_t len, size_t chunk_size) override;
+
+  void do_single_set(WorkerMooncakeConn& conn, const std::string& key,
+                     const void* buf, size_t len, size_t chunk_size) override;
+
+  bool do_single_exists(WorkerMooncakeConn& conn,
+                        const std::string& key) override;
+
+ private:
+  // Shared Mooncake RealClient instance.
+  std::shared_ptr<mooncake::RealClient> client_;
+
+  // The original config dict (kept for diagnostics).
+  ConfigDict config_;
+};
+
+}  // namespace connector
+}  // namespace lmcache
\ No newline at end of file
diff --git a/csrc/storage_backends/mooncake/pybind.cpp b/csrc/storage_backends/mooncake/pybind.cpp
new file mode 100644
index 0000000000..44c567e368
--- /dev/null
+++ b/csrc/storage_backends/mooncake/pybind.cpp
@@ -0,0 +1,14 @@
+// SPDX-License-Identifier: Apache-2.0
+#include <pybind11/pybind11.h>
+#include <pybind11/stl.h>
+#include "../connector_pybind_utils.h"
+#include "connector.h"
+
+namespace py = pybind11;
+
+PYBIND11_MODULE(lmcache_mooncake, m) {
+  py::class_<lmcache::connector::MooncakeConnector>(m, "LMCacheMooncakeClient")
+      .def(py::init<lmcache::connector::ConfigDict, int>(), py::arg("config"),
+           py::arg("num_workers"))
+          LMCACHE_BIND_CONNECTOR_METHODS(lmcache::connector::MooncakeConnector);
+}
diff --git a/docs/source/mp/l2_storage.rst b/docs/source/mp/l2_storage.rst
index a0b945086e..952038c127 100644
--- a/docs/source/mp/l2_storage.rst
+++ b/docs/source/mp/l2_storage.rst
@@ -128,6 +128,74 @@ object is stored as a raw ``.data`` file whose name encodes the full
     # With O_DIRECT for bypassing page cache
     --l2-adapter '{"type": "fs", "base_path": "/data/lmcache/l2", "use_odirect": true}'
 
+``mooncake_store`` -- Mooncake Store native connector
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+
+An L2 adapter backed by the native C++ Mooncake Store connector.  Uses
+`Mooncake <https://github.com/kvcache-ai/Mooncake>`_ for high-performance
+distributed KV cache storage with RDMA support.
+
+**Prerequisites -- Building with Mooncake support:**
+
+The Mooncake extension is **not** built by default.  You must explicitly
+enable it:
+
+.. code-block:: bash
+
+    BUILD_MOONCAKE=1 pip install -e . --verbose
+
+The ``BUILD_MOONCAKE`` environment variable controls compilation:
+
+- ``BUILD_MOONCAKE=1``: Enable the Mooncake C++ extension.
+- ``BUILD_MOONCAKE=0``: Force disable (highest priority), even if
+  ``MOONCAKE_INCLUDE_DIR`` is set.
+- **Not set**: Falls back to checking ``MOONCAKE_INCLUDE_DIR`` for
+  backward compatibility.  If ``MOONCAKE_INCLUDE_DIR`` is also unset,
+  the extension is skipped.
+
+If the Mooncake headers are not installed in the system include path
+(e.g., ``/usr/local/include``), you must point to them explicitly:
+
+.. code-block:: bash
+
+    BUILD_MOONCAKE=1 \
+    MOONCAKE_INCLUDE_DIR=/path/to/mooncake/include \
+    MOONCAKE_LIB_DIR=/path/to/mooncake/lib \
+    pip install -e . --verbose
+
+**LMCache-specific fields:**
+
+- ``num_workers``: Number of C++ worker threads (default ``4``, must
+  be > 0).
+
+**Mooncake fields:**
+
+All other keys in the JSON config (except ``type``, ``num_workers``,
+and ``eviction``) are forwarded **as-is** to Mooncake's
+``setup_internal(ConfigDict)``.  Refer to the
+`Mooncake documentation <https://github.com/kvcache-ai/Mooncake>`_
+for available setup keys (e.g., ``local_hostname``,
+``metadata_server``, ``master_server_address``, ``protocol``,
+``device_name``, ``global_segment_size``).
+
+**Configuration example:**
+
+.. code-block:: bash
+
+    --l2-adapter '{
+      "type": "mooncake_store",
+      "num_workers": 4,
+      "local_hostname": "node01",
+      "metadata_server": "http://localhost:8080/metadata",
+      "master_server_address": "localhost:50051",
+      "protocol": "tcp",
+      "local_buffer_size": "3221225472"
+      "global_segment_size": "3221225472"
+    }'
+
+For full Mooncake setup instructions (master service, metadata server,
+etc.), see `Mooncake <https://github.com/kvcache-ai/Mooncake>`_ .
+
 ``mock`` -- Mock adapter for testing
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 
@@ -335,6 +403,8 @@ drops by ``eviction_ratio``.
    * - ``mock``
      - Full support. Useful for testing eviction behaviour without
        real storage hardware.
+   * - ``mooncake_store``
+     - No eviction support (native connector adapter).
    * - ``fs``
      - No eviction support (``delete`` and ``get_usage`` are no-ops).
    * - native connectors
diff --git a/lmcache/v1/distributed/l2_adapters/mooncake_store_l2_adapter.py b/lmcache/v1/distributed/l2_adapters/mooncake_store_l2_adapter.py
new file mode 100644
index 0000000000..886789d398
--- /dev/null
+++ b/lmcache/v1/distributed/l2_adapters/mooncake_store_l2_adapter.py
@@ -0,0 +1,135 @@
+# SPDX-License-Identifier: Apache-2.0
+"""
+Mooncake Store native L2 adapter config and factory.
+"""
+
+# Future
+from __future__ import annotations
+
+# Standard
+from typing import (
+    TYPE_CHECKING,
+    Dict,
+    Optional,
+)
+
+if TYPE_CHECKING:
+    from lmcache.v1.distributed.internal_api import (
+        L1MemoryDesc,
+    )
+
+# First Party
+from lmcache.logging import init_logger
+from lmcache.v1.distributed.l2_adapters.base import (
+    L2AdapterInterface,
+)
+from lmcache.v1.distributed.l2_adapters.config import (
+    L2AdapterConfigBase,
+    register_l2_adapter_type,
+)
+from lmcache.v1.distributed.l2_adapters.factory import (
+    register_l2_adapter_factory,
+)
+
+logger = init_logger(__name__)
+
+# Keys consumed only by LMCache (never sent to mooncake).
+_LMCACHE_ONLY_KEYS = {"type", "num_workers", "eviction"}
+
+
+class MooncakeStoreL2AdapterConfig(L2AdapterConfigBase):
+    """Config for an L2 adapter backed by the native
+    C++ Mooncake Store connector.
+
+    ``setup_config`` is a string-to-string dict that is
+    forwarded **as-is** to mooncake's
+    ``RealClient::setup_internal(ConfigDict)``.
+    LMCache does NOT interpret, validate, or fill in
+    defaults for any mooncake keys — that is mooncake's
+    responsibility.
+
+    ``num_workers`` is the only LMCache-specific knob.
+    """
+
+    def __init__(
+        self,
+        setup_config: Dict[str, str],
+        num_workers: int = 4,
+    ):
+        super().__init__()
+        self.setup_config: Dict[str, str] = dict(setup_config)
+        self.num_workers = num_workers
+
+    @classmethod
+    def from_dict(cls, d: dict) -> "MooncakeStoreL2AdapterConfig":
+        num_workers = d.get("num_workers", 4)
+        if not isinstance(num_workers, int) or num_workers <= 0:
+            raise ValueError("num_workers must be a positive integer")
+
+        # Everything except LMCache-only keys is
+        # forwarded to mooncake as str values.
+        setup: Dict[str, str] = {}
+        for k, v in d.items():
+            if k in _LMCACHE_ONLY_KEYS:
+                continue
+            if v is not None:
+                setup[k] = str(v)
+
+        return cls(
+            setup_config=setup,
+            num_workers=num_workers,
+        )
+
+    @classmethod
+    def help(cls) -> str:
+        return (
+            "Mooncake Store L2 adapter config.\n"
+            "All keys except LMCache-only keys are "
+            "forwarded as-is to mooncake's "
+            "setup_internal(ConfigDict).\n"
+            "Refer to mooncake documentation for "
+            "available setup keys.\n"
+            "- num_workers (int): C++ worker threads "
+            "(default 4, >0)"
+        )
+
+
+def _create_mooncake_store_l2_adapter(
+    config: L2AdapterConfigBase,
+    l1_memory_desc: "Optional[L1MemoryDesc]" = None,
+) -> L2AdapterInterface:
+    """Create a NativeConnectorL2Adapter backed by the
+    C++ Mooncake Store connector."""
+    try:
+        # First Party
+        from lmcache.lmcache_mooncake import (
+            LMCacheMooncakeClient,
+        )
+    except ImportError as e:
+        raise RuntimeError(
+            "Mooncake Store L2 adapter requires the "
+            "C++ Mooncake extension. Build with: "
+            "MOONCAKE_INCLUDE_DIR=/path/to/mooncake-"
+            "store/include pip install -e ."
+        ) from e
+
+    # First Party
+    from lmcache.v1.distributed.l2_adapters.native_connector_l2_adapter import (  # noqa: E501
+        NativeConnectorL2Adapter,
+    )
+
+    assert isinstance(config, MooncakeStoreL2AdapterConfig)
+    native_client = LMCacheMooncakeClient(
+        config=config.setup_config,
+        num_workers=config.num_workers,
+    )
+    logger.info(
+        "Created Mooncake Store L2 adapter (workers=%d)",
+        config.num_workers,
+    )
+    return NativeConnectorL2Adapter(native_client)
+
+
+# Self-register config type and adapter factory
+register_l2_adapter_type("mooncake_store", MooncakeStoreL2AdapterConfig)
+register_l2_adapter_factory("mooncake_store", _create_mooncake_store_l2_adapter)
diff --git a/setup.py b/setup.py
index 79c76ce054..2d856d5ebd 100644
--- a/setup.py
+++ b/setup.py
@@ -60,6 +60,49 @@ def hipify_wrapper() -> None:
     assert len(hipified_sources) == len(extra_files)
 
 
+def _mooncake_extension(
+    cpp_extension,
+    mooncake_sources: list[str],
+    extra_cxx_flags: list[str],
+) -> list:
+    """Build mooncake CppExtension if enabled via env vars.
+
+    Returns a list with zero or one Extension objects.
+    """
+    mc_env = os.environ.get("BUILD_MOONCAKE")
+    if mc_env is not None:
+        build_mc = mc_env == "1"
+    else:
+        build_mc = os.environ.get("MOONCAKE_INCLUDE_DIR", "") != ""
+    if not build_mc:
+        return []
+
+    mc_include = os.environ.get("MOONCAKE_INCLUDE_DIR", "")
+    mc_lib = os.environ.get("MOONCAKE_LIB_DIR", "")
+    mc_include_dirs = [
+        "csrc/storage_backends",
+        "csrc/storage_backends/mooncake",
+    ]
+    if mc_include:
+        mc_include_dirs.extend(mc_include.split(";"))
+    mc_library_dirs: list[str] = []
+    if mc_lib:
+        mc_library_dirs.extend(mc_lib.split(";"))
+    return [
+        cpp_extension.CppExtension(
+            "lmcache.lmcache_mooncake",
+            sources=mooncake_sources,
+            include_dirs=mc_include_dirs,
+            library_dirs=mc_library_dirs,
+            libraries=["store"],
+            runtime_library_dirs=mc_library_dirs,
+            extra_compile_args={
+                "cxx": extra_cxx_flags + ["-O3", "-std=c++20", "-DYLT_ENABLE_IBV"],
+            },
+        ),
+    ]
+
+
 def cuda_extension() -> tuple[list, dict]:
     # Third Party
     from torch.utils import cpp_extension  # Import here
@@ -96,6 +139,10 @@ def cuda_extension() -> tuple[list, dict]:
         "csrc/storage_backends/fs/pybind.cpp",
         "csrc/storage_backends/fs/connector.cpp",
     ]
+    mooncake_sources = [
+        "csrc/storage_backends/mooncake/pybind.cpp",
+        "csrc/storage_backends/mooncake/connector.cpp",
+    ]
     ext_modules = [
         cpp_extension.CUDAExtension(
             "lmcache.c_ops",
@@ -130,6 +177,10 @@ def cuda_extension() -> tuple[list, dict]:
             },
         ),
     ]
+    # Mooncake extension is optional.
+    ext_modules.extend(
+        _mooncake_extension(cpp_extension, mooncake_sources, [flag_cxx_abi])
+    )
     cmdclass = {"build_ext": cpp_extension.BuildExtension}
     return ext_modules, cmdclass
 
@@ -165,6 +216,10 @@ def rocm_extension() -> tuple[list, dict]:
         "csrc/storage_backends/fs/pybind.cpp",
         "csrc/storage_backends/fs/connector.cpp",
     ]
+    mooncake_sources = [
+        "csrc/storage_backends/mooncake/pybind.cpp",
+        "csrc/storage_backends/mooncake/connector.cpp",
+    ]
     # For HIP, we generally use CppExtension and let hipcc handle things.
     # Ensure CXX environment variable is set to hipcc when running this build.
     # e.g., CXX=hipcc python setup.py install
@@ -221,6 +276,8 @@ def rocm_extension() -> tuple[list, dict]:
             },
         ),
     ]
+    # Mooncake extension is optional.
+    ext_modules.extend(_mooncake_extension(cpp_extension, mooncake_sources, []))
     cmdclass = {"build_ext": cpp_extension.BuildExtension}
     return ext_modules, cmdclass
 
diff --git a/tests/v1/distributed/test_mooncake_store_l2_adapter.py b/tests/v1/distributed/test_mooncake_store_l2_adapter.py
new file mode 100644
index 0000000000..2dca0bdaa3
--- /dev/null
+++ b/tests/v1/distributed/test_mooncake_store_l2_adapter.py
@@ -0,0 +1,457 @@
+# SPDX-License-Identifier: Apache-2.0
+"""
+Tests for MooncakeStoreL2AdapterConfig and factory registration.
+
+Integration tests require the C++ Mooncake extension and a running
+Mooncake Store service.  They are skipped automatically when the
+extension is not available.
+"""
+
+# Standard
+import os
+import select
+
+# Third Party
+import pytest
+import torch
+
+# First Party
+from lmcache.v1.distributed.api import ObjectKey
+from lmcache.v1.distributed.l2_adapters.config import (
+    get_registered_l2_adapter_types,
+    get_type_name_for_config,
+)
+from lmcache.v1.distributed.l2_adapters.factory import (
+    create_l2_adapter_from_registry,
+)
+from lmcache.v1.distributed.l2_adapters.mooncake_store_l2_adapter import (
+    MooncakeStoreL2AdapterConfig,
+)
+from lmcache.v1.memory_management import (
+    MemoryFormat,
+    MemoryObjMetadata,
+    TensorMemoryObj,
+)
+
+# =============================================================================
+# Helpers
+# =============================================================================
+
+
+def _native_mooncake_available() -> bool:
+    """Check if the C++ Mooncake extension can be imported."""
+    try:
+        # First Party
+        from lmcache.lmcache_mooncake import LMCacheMooncakeClient  # noqa: F401
+
+        return True
+    except ImportError:
+        return False
+
+
+requires_mooncake = pytest.mark.skipif(
+    not _native_mooncake_available(),
+    reason="C++ Mooncake extension (lmcache_mooncake) not available",
+)
+
+
+def create_object_key(chunk_id: int, model_name: str = "test_model") -> ObjectKey:
+    return ObjectKey(
+        chunk_hash=ObjectKey.IntHash2Bytes(chunk_id),
+        model_name=model_name,
+        kv_rank=0,
+    )
+
+
+def create_memory_obj(size: int = 256, fill_value: float = 1.0) -> TensorMemoryObj:
+    raw_data = torch.empty(size, dtype=torch.float32)
+    raw_data.fill_(fill_value)
+    metadata = MemoryObjMetadata(
+        shape=torch.Size([size]),
+        dtype=torch.float32,
+        address=0,
+        phy_size=size * 4,
+        fmt=MemoryFormat.KV_2LTD,
+        ref_count=1,
+    )
+    return TensorMemoryObj(raw_data, metadata, parent_allocator=None)
+
+
+def wait_for_event_fd(event_fd: int, timeout: float = 10.0) -> bool:
+    poll = select.poll()
+    poll.register(event_fd, select.POLLIN)
+    events = poll.poll(timeout * 1000)
+    if events:
+        try:
+            os.eventfd_read(event_fd)
+        except BlockingIOError:
+            pass
+        return True
+    return False
+
+
+# =============================================================================
+# Config Unit Tests (no C++ extension needed)
+# =============================================================================
+
+
+class TestMooncakeStoreL2AdapterConfig:
+    """Unit tests for MooncakeStoreL2AdapterConfig."""
+
+    def test_from_dict_minimal(self):
+        """Minimal dict with only mooncake keys should work."""
+        d = {
+            "type": "mooncake_store",
+            "local_hostname": "192.168.1.1",
+            "metadata_server": "etcd://localhost:2379",
+            "global_segment_size": "3221225472",
+            "local_buffer_size": "1073741824",
+            "protocol": "tcp",
+        }
+        config = MooncakeStoreL2AdapterConfig.from_dict(d)
+
+        # LMCache-only keys should be stripped
+        assert "type" not in config.setup_config
+
+        # Mooncake keys should be forwarded as strings
+        assert config.setup_config["local_hostname"] == "192.168.1.1"
+        assert config.setup_config["metadata_server"] == "etcd://localhost:2379"
+        assert config.setup_config["protocol"] == "tcp"
+
+        # Default num_workers
+        assert config.num_workers == 4
+
+    def test_from_dict_with_num_workers(self):
+        """num_workers should be parsed and excluded from setup_config."""
+        d = {
+            "type": "mooncake_store",
+            "num_workers": 8,
+            "local_hostname": "10.0.0.1",
+        }
+        config = MooncakeStoreL2AdapterConfig.from_dict(d)
+
+        assert config.num_workers == 8
+        assert "num_workers" not in config.setup_config
+        assert config.setup_config["local_hostname"] == "10.0.0.1"
+
+    def test_from_dict_strips_lmcache_only_keys(self):
+        """LMCache-only keys (type, num_workers, eviction) should
+        not appear in setup_config."""
+        d = {
+            "type": "mooncake_store",
+            "num_workers": 2,
+            "eviction": "lru",
+            "local_hostname": "host1",
+        }
+        config = MooncakeStoreL2AdapterConfig.from_dict(d)
+
+        assert "type" not in config.setup_config
+        assert "num_workers" not in config.setup_config
+        assert "eviction" not in config.setup_config
+        assert config.setup_config["local_hostname"] == "host1"
+
+    def test_from_dict_converts_values_to_str(self):
+        """Non-string values should be converted to strings."""
+        d = {
+            "type": "mooncake_store",
+            "global_segment_size": 3221225472,
+            "local_buffer_size": 1073741824,
+        }
+        config = MooncakeStoreL2AdapterConfig.from_dict(d)
+
+        assert config.setup_config["global_segment_size"] == "3221225472"
+        assert config.setup_config["local_buffer_size"] == "1073741824"
+
+    def test_from_dict_skips_none_values(self):
+        """Keys with None values should be excluded from setup_config."""
+        d = {
+            "type": "mooncake_store",
+            "local_hostname": "host1",
+            "optional_key": None,
+        }
+        config = MooncakeStoreL2AdapterConfig.from_dict(d)
+
+        assert "optional_key" not in config.setup_config
+        assert config.setup_config["local_hostname"] == "host1"
+
+    def test_from_dict_invalid_num_workers_zero(self):
+        """num_workers=0 should raise ValueError."""
+        d = {"type": "mooncake_store", "num_workers": 0}
+        with pytest.raises(ValueError, match="num_workers"):
+            MooncakeStoreL2AdapterConfig.from_dict(d)
+
+    def test_from_dict_invalid_num_workers_negative(self):
+        """Negative num_workers should raise ValueError."""
+        d = {"type": "mooncake_store", "num_workers": -1}
+        with pytest.raises(ValueError, match="num_workers"):
+            MooncakeStoreL2AdapterConfig.from_dict(d)
+
+    def test_from_dict_invalid_num_workers_string(self):
+        """Non-integer num_workers should raise ValueError."""
+        d = {"type": "mooncake_store", "num_workers": "four"}
+        with pytest.raises(ValueError, match="num_workers"):
+            MooncakeStoreL2AdapterConfig.from_dict(d)
+
+    def test_constructor_copies_setup_config(self):
+        """Constructor should copy the setup_config dict."""
+        original = {"key": "value"}
+        config = MooncakeStoreL2AdapterConfig(setup_config=original)
+
+        # Mutating the original should not affect the config
+        original["key"] = "changed"
+        assert config.setup_config["key"] == "value"
+
+    def test_help_returns_string(self):
+        """help() should return a non-empty string."""
+        h = MooncakeStoreL2AdapterConfig.help()
+        assert isinstance(h, str)
+        assert len(h) > 0
+
+
+# =============================================================================
+# Factory Registration Tests (no C++ extension needed)
+# =============================================================================
+
+
+class TestMooncakeStoreRegistration:
+    """Tests for factory and config type registration."""
+
+    def test_mooncake_store_type_registered(self):
+        """'mooncake_store' should be in the registered adapter types."""
+        assert "mooncake_store" in get_registered_l2_adapter_types()
+
+    def test_config_type_name(self):
+        """get_type_name_for_config should return 'mooncake_store'."""
+        config = MooncakeStoreL2AdapterConfig(setup_config={})
+        name = get_type_name_for_config(config)
+        assert name == "mooncake_store"
+
+    def test_factory_raises_without_extension(self):
+        """Factory should raise RuntimeError when C++ extension
+        is not available."""
+        if _native_mooncake_available():
+            pytest.skip("C++ Mooncake extension is available")
+
+        config = MooncakeStoreL2AdapterConfig(
+            setup_config={"local_hostname": "localhost"},
+            num_workers=2,
+        )
+        with pytest.raises(RuntimeError, match="Mooncake"):
+            create_l2_adapter_from_registry(config)
+
+
+# =============================================================================
+# Integration Tests (require C++ Mooncake extension + running service)
+# =============================================================================
+
+# Mooncake service connection params from environment
+MOONCAKE_LOCAL_HOSTNAME = os.environ.get("MOONCAKE_LOCAL_HOSTNAME", "")
+MOONCAKE_METADATA_SERVER = os.environ.get(
+    "MOONCAKE_METADATA_SERVER", "etcd://localhost:2379"
+)
+
+requires_mooncake_service = pytest.mark.skipif(
+    not _native_mooncake_available() or not MOONCAKE_LOCAL_HOSTNAME,
+    reason=("C++ Mooncake extension not available or MOONCAKE_LOCAL_HOSTNAME not set"),
+)
+
+
+@requires_mooncake_service
+class TestMooncakeStoreIntegration:
+    """Integration tests using real Mooncake Store service.
+
+    These tests require:
+    1. The C++ Mooncake extension (lmcache_mooncake) to be built
+    2. A running Mooncake Store service
+    3. MOONCAKE_LOCAL_HOSTNAME environment variable set
+
+    Set environment variables before running:
+        export MOONCAKE_LOCAL_HOSTNAME=<your-ip>
+        export MOONCAKE_METADATA_SERVER=etcd://<etcd-host>:2379
+    """
+
+    @pytest.fixture(autouse=True)
+    def setup_adapter(self):
+        # First Party
+        from lmcache.v1.distributed.l2_adapters import create_l2_adapter
+
+        config = MooncakeStoreL2AdapterConfig.from_dict(
+            {
+                "type": "mooncake_store",
+                "local_hostname": MOONCAKE_LOCAL_HOSTNAME,
+                "metadata_server": MOONCAKE_METADATA_SERVER,
+                "num_workers": 2,
+            }
+        )
+        self.adapter = create_l2_adapter(config)
+        yield
+        self.adapter.close()
+
+    def test_event_fds_are_distinct(self):
+        """Each operation should have a distinct event fd."""
+        fds = {
+            self.adapter.get_store_event_fd(),
+            self.adapter.get_lookup_and_lock_event_fd(),
+            self.adapter.get_load_event_fd(),
+        }
+        assert len(fds) == 3
+
+    def test_store_and_lookup(self):
+        """Store objects, then verify lookup finds them."""
+        keys = [create_object_key(i) for i in range(5)]
+        objs = [create_memory_obj(size=64, fill_value=float(i)) for i in range(5)]
+
+        store_fd = self.adapter.get_store_event_fd()
+        lookup_fd = self.adapter.get_lookup_and_lock_event_fd()
+
+        # Store
+        store_tid = self.adapter.submit_store_task(keys, objs)
+        assert wait_for_event_fd(store_fd)
+        completed = self.adapter.pop_completed_store_tasks()
+        assert completed[store_tid] is True
+
+        # Lookup all — should find everything
+        lookup_tid = self.adapter.submit_lookup_and_lock_task(keys)
+        assert wait_for_event_fd(lookup_fd)
+        bitmap = self.adapter.query_lookup_and_lock_result(lookup_tid)
+        assert bitmap is not None
+        for i in range(5):
+            assert bitmap.test(i) is True, f"Key {i} not found in lookup"
+
+        # Unlock
+        self.adapter.submit_unlock(keys)
+
+    def test_lookup_nonexistent_keys(self):
+        """Lookup for keys not stored should return all zeros."""
+        keys = [create_object_key(i + 10000) for i in range(3)]
+        lookup_fd = self.adapter.get_lookup_and_lock_event_fd()
+
+        lookup_tid = self.adapter.submit_lookup_and_lock_task(keys)
+        assert wait_for_event_fd(lookup_fd)
+        bitmap = self.adapter.query_lookup_and_lock_result(lookup_tid)
+        assert bitmap is not None
+        for i in range(3):
+            assert bitmap.test(i) is False
+
+    def test_full_store_lookup_load_workflow(self):
+        """End-to-end: store -> lookup -> load, verify data integrity."""
+        key = create_object_key(42)
+        store_obj = create_memory_obj(size=512, fill_value=3.14)
+        load_obj = create_memory_obj(size=512, fill_value=0.0)
+
+        store_fd = self.adapter.get_store_event_fd()
+        lookup_fd = self.adapter.get_lookup_and_lock_event_fd()
+        load_fd = self.adapter.get_load_event_fd()
+
+        # Store
+        store_tid = self.adapter.submit_store_task([key], [store_obj])
+        assert wait_for_event_fd(store_fd)
+        assert self.adapter.pop_completed_store_tasks()[store_tid] is True
+
+        # Lookup
+        lookup_tid = self.adapter.submit_lookup_and_lock_task([key])
+        assert wait_for_event_fd(lookup_fd)
+        bitmap = self.adapter.query_lookup_and_lock_result(lookup_tid)
+        assert bitmap.test(0) is True
+
+        # Load
+        load_tid = self.adapter.submit_load_task([key], [load_obj])
+        assert wait_for_event_fd(load_fd)
+        bitmap = self.adapter.query_load_result(load_tid)
+        assert bitmap.test(0) is True
+
+        # Verify data integrity
+        assert torch.allclose(load_obj.tensor, store_obj.tensor), (
+            "Loaded data does not match stored data"
+        )
+
+        # Unlock
+        self.adapter.submit_unlock([key])
+
+    def test_batch_store_lookup_load(self):
+        """Batch workflow with multiple objects."""
+        n = 10
+        keys = [create_object_key(i + 100) for i in range(n)]
+        store_objs = [
+            create_memory_obj(size=128, fill_value=float(i * 7)) for i in range(n)
+        ]
+        load_objs = [create_memory_obj(size=128, fill_value=0.0) for _ in range(n)]
+
+        store_fd = self.adapter.get_store_event_fd()
+        lookup_fd = self.adapter.get_lookup_and_lock_event_fd()
+        load_fd = self.adapter.get_load_event_fd()
+
+        # Store all
+        store_tid = self.adapter.submit_store_task(keys, store_objs)
+        assert wait_for_event_fd(store_fd)
+        assert self.adapter.pop_completed_store_tasks()[store_tid] is True
+
+        # Lookup all
+        lookup_tid = self.adapter.submit_lookup_and_lock_task(keys)
+        assert wait_for_event_fd(lookup_fd)
+        bitmap = self.adapter.query_lookup_and_lock_result(lookup_tid)
+        for i in range(n):
+            assert bitmap.test(i) is True
+
+        # Load all
+        load_tid = self.adapter.submit_load_task(keys, load_objs)
+        assert wait_for_event_fd(load_fd)
+        bitmap = self.adapter.query_load_result(load_tid)
+        for i in range(n):
+            assert bitmap.test(i) is True
+            assert torch.allclose(load_objs[i].tensor, store_objs[i].tensor), (
+                f"Data mismatch for key {i}"
+            )
+
+        self.adapter.submit_unlock(keys)
+
+    def test_mixed_lookup_existing_and_missing(self):
+        """Lookup a mix of stored and non-stored keys."""
+        stored_keys = [create_object_key(i + 200) for i in range(3)]
+        stored_objs = [create_memory_obj(fill_value=float(i)) for i in range(3)]
+
+        store_fd = self.adapter.get_store_event_fd()
+        lookup_fd = self.adapter.get_lookup_and_lock_event_fd()
+
+        # Store first 3
+        self.adapter.submit_store_task(stored_keys, stored_objs)
+        assert wait_for_event_fd(store_fd)
+        self.adapter.pop_completed_store_tasks()
+
+        # Lookup 5 keys (3 stored + 2 missing)
+        all_keys = stored_keys + [
+            create_object_key(10100),
+            create_object_key(10101),
+        ]
+        lookup_tid = self.adapter.submit_lookup_and_lock_task(all_keys)
+        assert wait_for_event_fd(lookup_fd)
+        bitmap = self.adapter.query_lookup_and_lock_result(lookup_tid)
+
+        for i in range(3):
+            assert bitmap.test(i) is True, f"Stored key {i} should be found"
+        assert bitmap.test(3) is False, "Missing key should not be found"
+        assert bitmap.test(4) is False, "Missing key should not be found"
+
+        self.adapter.submit_unlock(stored_keys)
+
+    def test_factory_creates_adapter(self):
+        """Verify the factory can create a Mooncake Store L2 adapter."""
+        # First Party
+        from lmcache.v1.distributed.l2_adapters import create_l2_adapter
+
+        config = MooncakeStoreL2AdapterConfig.from_dict(
+            {
+                "type": "mooncake_store",
+                "local_hostname": MOONCAKE_LOCAL_HOSTNAME,
+                "metadata_server": MOONCAKE_METADATA_SERVER,
+                "num_workers": 2,
+            }
+        )
+        adapter = create_l2_adapter(config)
+        try:
+            # Should have valid event fds
+            assert adapter.get_store_event_fd() >= 0
+            assert adapter.get_lookup_and_lock_event_fd() >= 0
+            assert adapter.get_load_event_fd() >= 0
+        finally:
+            adapter.close()

From 267ce70b5523a78c8f6c26052faa8904816698ef Mon Sep 17 00:00:00 2001
From: jooho-xcena <jooho.lee@xcena.com>
Date: Tue, 31 Mar 2026 06:24:21 +0000
Subject: [PATCH 07/10] feat(storage): add write-back to local CPU for
 non-blocking get paths

- get_non_blocking: add done callback to write-back fetched data
  to LocalCPUBackend, matching existing get() behavior
- prefetch_single_done_callback: write-back prefetched data to
  LocalCPUBackend after async prefetch completes

Signed-off-by: jooho-xcena <jooho.lee@xcena.com>
---
 lmcache/v1/storage_backend/storage_manager.py | 35 +++++++++++++++++--
 1 file changed, 32 insertions(+), 3 deletions(-)

diff --git a/lmcache/v1/storage_backend/storage_manager.py b/lmcache/v1/storage_backend/storage_manager.py
index e55ce860a6..975408e014 100644
--- a/lmcache/v1/storage_backend/storage_manager.py
+++ b/lmcache/v1/storage_backend/storage_manager.py
@@ -473,7 +473,20 @@ def get_non_blocking(
             # NOTE(Jiayi): bypass the allocator for now
             task = backend.get_non_blocking(key)
             if task:
-                # TODO (Jiayi): add write-back logic here
+                if (
+                    backend_name not in ["LocalCPUBackend", "PDBackend"]
+                    and "LocalCPUBackend" in self.storage_backends
+                ):
+                    def _write_back(fut, k=key):
+                        memory_obj = fut.result()
+                        if memory_obj is not None:
+                            local_cpu = self.storage_backends[
+                                "LocalCPUBackend"
+                            ]
+                            assert isinstance(local_cpu, LocalCPUBackend)
+                            local_cpu.submit_put_task(k, memory_obj)
+
+                    task.add_done_callback(_write_back)
                 return task
         return None
 
@@ -549,8 +562,24 @@ def prefetch_single_done_callback(
         Callback function when a single prefetch task
         (i.e., prefetching from a single backend) is done.
         """
-        # TODO(Jiayi): support write-back policy here
-        pass
+        if (
+            backend_name not in ["LocalCPUBackend", "PDBackend"]
+            and "LocalCPUBackend" in self.storage_backends
+        ):
+            try:
+                memory_objs = future.result()
+                if memory_objs:
+                    local_cpu = self.storage_backends["LocalCPUBackend"]
+                    assert isinstance(local_cpu, LocalCPUBackend)
+                    local_cpu.batched_submit_put_task(
+                        keys[: len(memory_objs)], memory_objs
+                    )
+            except Exception as e:
+                logger.warning(
+                    "Write-back to LocalCPUBackend failed for %s: %s",
+                    backend_name,
+                    e,
+                )
 
     def prefetch_all_done_callback(
         self,

From e419eafd100cc5f94ff171f719502e540cdded1b Mon Sep 17 00:00:00 2001
From: jooho-xcena <jooho.lee@xcena.com>
Date: Tue, 31 Mar 2026 06:25:42 +0000
Subject: [PATCH 08/10] fix: add try-except to get_non_blocking write-back
 callback

Align error handling with prefetch_single_done_callback for
consistency. Prevents unhandled exceptions in Future callbacks.

Signed-off-by: jooho-xcena <jooho.lee@xcena.com>
---
 lmcache/v1/storage_backend/storage_manager.py | 20 ++++++++++++-------
 1 file changed, 13 insertions(+), 7 deletions(-)

diff --git a/lmcache/v1/storage_backend/storage_manager.py b/lmcache/v1/storage_backend/storage_manager.py
index 975408e014..7c1abc40c9 100644
--- a/lmcache/v1/storage_backend/storage_manager.py
+++ b/lmcache/v1/storage_backend/storage_manager.py
@@ -478,13 +478,19 @@ def get_non_blocking(
                     and "LocalCPUBackend" in self.storage_backends
                 ):
                     def _write_back(fut, k=key):
-                        memory_obj = fut.result()
-                        if memory_obj is not None:
-                            local_cpu = self.storage_backends[
-                                "LocalCPUBackend"
-                            ]
-                            assert isinstance(local_cpu, LocalCPUBackend)
-                            local_cpu.submit_put_task(k, memory_obj)
+                        try:
+                            memory_obj = fut.result()
+                            if memory_obj is not None:
+                                local_cpu = self.storage_backends[
+                                    "LocalCPUBackend"
+                                ]
+                                assert isinstance(local_cpu, LocalCPUBackend)
+                                local_cpu.submit_put_task(k, memory_obj)
+                        except Exception as e:
+                            logger.warning(
+                                "Write-back to LocalCPUBackend failed: %s",
+                                e,
+                            )
 
                     task.add_done_callback(_write_back)
                 return task

From 8ac9ece1b08cecefd91bdf5d6c1fb026be569277 Mon Sep 17 00:00:00 2001
From: jooho-xcena <jooho.lee@xcena.com>
Date: Fri, 3 Apr 2026 08:10:51 +0000
Subject: [PATCH 09/10] fix: add MaruBackend to write-back exclusion list

Align with existing get() and batched_get() which exclude
MaruBackend from write-back to LocalCPUBackend.

Signed-off-by: jooho-xcena <jooho.lee@xcena.com>
---
 lmcache/v1/storage_backend/storage_manager.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/lmcache/v1/storage_backend/storage_manager.py b/lmcache/v1/storage_backend/storage_manager.py
index 7c1abc40c9..b9b75e6f91 100644
--- a/lmcache/v1/storage_backend/storage_manager.py
+++ b/lmcache/v1/storage_backend/storage_manager.py
@@ -474,7 +474,7 @@ def get_non_blocking(
             task = backend.get_non_blocking(key)
             if task:
                 if (
-                    backend_name not in ["LocalCPUBackend", "PDBackend"]
+                    backend_name not in ["LocalCPUBackend", "PDBackend", "MaruBackend"]
                     and "LocalCPUBackend" in self.storage_backends
                 ):
                     def _write_back(fut, k=key):
@@ -569,7 +569,7 @@ def prefetch_single_done_callback(
         (i.e., prefetching from a single backend) is done.
         """
         if (
-            backend_name not in ["LocalCPUBackend", "PDBackend"]
+            backend_name not in ["LocalCPUBackend", "PDBackend", "MaruBackend"]
             and "LocalCPUBackend" in self.storage_backends
         ):
             try:

From 7a62bad8f36098c844457004cd71da0dbebfc789 Mon Sep 17 00:00:00 2001
From: jooho-xcena <jooho.lee@xcena.com>
Date: Fri, 3 Apr 2026 08:12:05 +0000
Subject: [PATCH 10/10] style: apply ruff-format

Signed-off-by: jooho-xcena <jooho.lee@xcena.com>
---
 lmcache/v1/storage_backend/storage_manager.py | 5 ++---
 1 file changed, 2 insertions(+), 3 deletions(-)

diff --git a/lmcache/v1/storage_backend/storage_manager.py b/lmcache/v1/storage_backend/storage_manager.py
index b9b75e6f91..f1756eea76 100644
--- a/lmcache/v1/storage_backend/storage_manager.py
+++ b/lmcache/v1/storage_backend/storage_manager.py
@@ -477,13 +477,12 @@ def get_non_blocking(
                     backend_name not in ["LocalCPUBackend", "PDBackend", "MaruBackend"]
                     and "LocalCPUBackend" in self.storage_backends
                 ):
+
                     def _write_back(fut, k=key):
                         try:
                             memory_obj = fut.result()
                             if memory_obj is not None:
-                                local_cpu = self.storage_backends[
-                                    "LocalCPUBackend"
-                                ]
+                                local_cpu = self.storage_backends["LocalCPUBackend"]
                                 assert isinstance(local_cpu, LocalCPUBackend)
                                 local_cpu.submit_put_task(k, memory_obj)
                         except Exception as e: