GenerativeAgents · os1ma · Jan 5, 2026 · Jan 26, 2026 · Jan 26, 2026 · Jan 27, 2026
diff --git a/.env.template b/.env.template
@@ -1,7 +1,5 @@
 OPENAI_API_KEY=
-LANGCHAIN_TRACING_V2=false
-LANGCHAIN_ENDPOINT=https://api.smith.langchain.com
-LANGCHAIN_API_KEY=
-LANGCHAIN_PROJECT=training-llm-app
+WANDB_API_KEY=
+WEAVE_PROJECT_NAME=
 COHERE_API_KEY=
 TAVILY_API_KEY=
diff --git a/app/advanced_rag/chains/base.py b/app/advanced_rag/chains/base.py
@@ -14,9 +14,16 @@ def __init__(self, token: str):
         self.token = token
 
 
+class WeaveCallId:
+    def __init__(self, weave_call_id: str | None):
+        self.weave_call_id = weave_call_id
+
+
 class BaseRAGChain(ABC):
     @abstractmethod
-    def stream(self, question: str) -> Generator[Context | AnswerToken, None, None]:
+    def stream(
+        self, question: str
+    ) -> Generator[Context | AnswerToken | WeaveCallId, None, None]:
         pass
 
 

diff --git a/app/advanced_rag/chains/hybrid.py b/app/advanced_rag/chains/hybrid.py
@@ -11,16 +11,7 @@
 from langsmith import traceable
 
 from app.advanced_rag.chains.base import AnswerToken, BaseRAGChain, Context, reduce_fn
-
-_generate_answer_prompt_template = '''
-以下の文脈だけを踏まえて質問に回答してください。
-
-文脈: """
-{context}
-"""
-
-質問: {question}
-'''
+from app.prompts import generate_answer_prompt
 
 
 @traceable
@@ -96,11 +87,11 @@ def stream(self, question: str) -> Generator[Context | AnswerToken, None, None]:
         yield Context(documents=documents)
 
         # 回答を生成して徐々に応答を返す
-        generate_answer_prompt = _generate_answer_prompt_template.format(
+        generate_answer_prompt_text = generate_answer_prompt.format(
             context=documents,
             question=question,
         )
-        for chunk in self.model.stream(generate_answer_prompt):
+        for chunk in self.model.stream(generate_answer_prompt_text):
             yield AnswerToken(token=chunk.content)
 
 

diff --git a/app/advanced_rag/chains/hyde.py b/app/advanced_rag/chains/hyde.py
@@ -1,27 +1,12 @@
 from typing import Generator
 
+import weave
 from langchain.embeddings import init_embeddings
 from langchain_chroma import Chroma
 from langchain_core.language_models import BaseChatModel
-from langsmith import traceable
 
-from app.advanced_rag.chains.base import AnswerToken, BaseRAGChain, Context, reduce_fn
-
-_hypothetical_prompt_template = """\
-次の質問に回答する一文を書いてください。
-
-質問: {question}
-"""
-
-_generate_answer_prompt_template = '''
-以下の文脈だけを踏まえて質問に回答してください。
-
-文脈: """
-{context}
-"""
-
-質問: {question}
-'''
+from app.advanced_rag.chains.base import AnswerToken, BaseRAGChain, Context, WeaveCallId
+from app.prompts import generate_answer_prompt, hypothetical_prompt
 
 
 class HyDERAGChain(BaseRAGChain):
@@ -36,22 +21,27 @@ def __init__(self, model: BaseChatModel):
         )
         self.retriever = vector_store.as_retriever(search_kwargs={"k": 5})
 
-    @traceable(name="hyde", reduce_fn=reduce_fn)
-    def stream(self, question: str) -> Generator[Context | AnswerToken, None, None]:
+    @weave.op(name="hyde")
+    def stream(
+        self, question: str
+    ) -> Generator[Context | AnswerToken | WeaveCallId, None, None]:
+        current_call = weave.require_current_call()
+        yield WeaveCallId(weave_call_id=current_call.id)
+
         # 仮説的な回答を生成
-        hypothetical_prompt = _hypothetical_prompt_template.format(question=question)
-        hypothetical_answer = self.model.invoke(hypothetical_prompt)
+        hypothetical_prompt_text = hypothetical_prompt.format(question=question)
+        hypothetical_answer = self.model.invoke(hypothetical_prompt_text)
 
         # 検索して検索結果を返す
         documents = self.retriever.invoke(hypothetical_answer.content)
         yield Context(documents=documents)
 
         # 回答を生成して徐々に応答を返す
-        generate_answer_prompt = _generate_answer_prompt_template.format(
+        generate_answer_prompt_text = generate_answer_prompt.format(
             context=documents,
             question=question,
         )
-        for chunk in self.model.stream(generate_answer_prompt):
+        for chunk in self.model.stream(generate_answer_prompt_text):
             yield AnswerToken(token=chunk.content)
 
 

diff --git a/app/advanced_rag/chains/multi_query.py b/app/advanced_rag/chains/multi_query.py
@@ -1,39 +1,19 @@
 from typing import Generator
 
+import weave
 from langchain.embeddings import init_embeddings
 from langchain_chroma import Chroma
 from langchain_core.language_models import BaseChatModel
-from langsmith import traceable
 from pydantic import BaseModel, Field
 
-from app.advanced_rag.chains.base import AnswerToken, BaseRAGChain, Context, reduce_fn
+from app.advanced_rag.chains.base import AnswerToken, BaseRAGChain, Context, WeaveCallId
+from app.prompts import generate_answer_prompt, query_generation_prompt
 
 
 class QueryGenerationOutput(BaseModel):
     queries: list[str] = Field(..., description="検索クエリのリスト")
 
 
-_query_generation_prompt_template = """\
-質問に対してベクターデータベースから関連文書を検索するために、
-3つの異なる検索クエリを生成してください。
-距離ベースの類似性検索の限界を克服するために、
-ユーザーの質問に対して複数の視点を提供することが目標です。
-
-質問: {question}
-"""
-
-
-_generate_answer_prompt_template = '''
-以下の文脈だけを踏まえて質問に回答してください。
-
-文脈: """
-{context}
-"""
-
-質問: {question}
-'''
-
-
 class MultiQueryRAGChain(BaseRAGChain):
     def __init__(self, model: BaseChatModel):
         self.model = model
@@ -46,15 +26,20 @@ def __init__(self, model: BaseChatModel):
         )
         self.retriever = vector_store.as_retriever(search_kwargs={"k": 5})
 
-    @traceable(name="multi_query", reduce_fn=reduce_fn)
-    def stream(self, question: str) -> Generator[Context | AnswerToken, None, None]:
+    @weave.op(name="multi_query")
+    def stream(
+        self, question: str
+    ) -> Generator[Context | AnswerToken | WeaveCallId, None, None]:
+        current_call = weave.require_current_call()
+        yield WeaveCallId(weave_call_id=current_call.id)
+
         # 検索クエリを生成する
-        query_generation_prompt = _query_generation_prompt_template.format(
+        query_generation_prompt_text = query_generation_prompt.format(
             question=question
         )
         model_with_structure = self.model.with_structured_output(QueryGenerationOutput)
         query_generation_output: QueryGenerationOutput = model_with_structure.invoke(
-            query_generation_prompt
+            query_generation_prompt_text
         )  # type: ignore[assignment]
 
         # 検索して検索結果を返す
@@ -63,11 +48,11 @@ def stream(self, question: str) -> Generator[Context | AnswerToken, None, None]:
         yield Context(documents=documents)
 
         # 回答を生成して徐々に応答を返す
-        generate_answer_prompt = _generate_answer_prompt_template.format(
+        generate_answer_prompt_text = generate_answer_prompt.format(
             context=documents,
             question=question,
         )
-        for chunk in self.model.stream(generate_answer_prompt):
+        for chunk in self.model.stream(generate_answer_prompt_text):
             yield AnswerToken(token=chunk.content)
 
 

diff --git a/app/advanced_rag/chains/naive.py b/app/advanced_rag/chains/naive.py
@@ -1,21 +1,12 @@
 from typing import Generator
 
+import weave
 from langchain.embeddings import init_embeddings
 from langchain_chroma import Chroma
 from langchain_core.language_models import BaseChatModel
-from langsmith import traceable
 
-from app.advanced_rag.chains.base import AnswerToken, BaseRAGChain, Context, reduce_fn
-
-_generate_answer_prompt_template = '''
-以下の文脈だけを踏まえて質問に回答してください。
-
-文脈: """
-{context}
-"""
-
-質問: {question}
-'''
+from app.advanced_rag.chains.base import AnswerToken, BaseRAGChain, Context, WeaveCallId
+from app.prompts import generate_answer_prompt
 
 
 class NaiveRAGChain(BaseRAGChain):
@@ -30,14 +21,19 @@ def __init__(self, model: BaseChatModel):
         )
         self.retriever = vector_store.as_retriever(search_kwargs={"k": 5})
 
-    @traceable(name="naive", reduce_fn=reduce_fn)
-    def stream(self, question: str) -> Generator[Context | AnswerToken, None, None]:
+    @weave.op(name="naive")
+    def stream(
+        self, question: str
+    ) -> Generator[Context | AnswerToken | WeaveCallId, None, None]:
+        current_call = weave.require_current_call()
+        yield WeaveCallId(weave_call_id=current_call.id)
+
         # 検索して検索結果を返す
         documents = self.retriever.invoke(question)
         yield Context(documents=documents)
 
         # 回答を生成して徐々に応答を返す
-        prompt = _generate_answer_prompt_template.format(
+        prompt = generate_answer_prompt.format(
             context=documents,
             question=question,
         )

diff --git a/app/advanced_rag/chains/rag_fusion.py b/app/advanced_rag/chains/rag_fusion.py
@@ -1,42 +1,22 @@
 from typing import Generator
 
+import weave
 from langchain.embeddings import init_embeddings
 from langchain_chroma import Chroma
 from langchain_core.documents import Document
 from langchain_core.language_models import BaseChatModel
 from langchain_core.load import dumps, loads
-from langsmith import traceable
 from pydantic import BaseModel, Field
 
-from app.advanced_rag.chains.base import AnswerToken, BaseRAGChain, Context, reduce_fn
+from app.advanced_rag.chains.base import AnswerToken, BaseRAGChain, Context
+from app.prompts import generate_answer_prompt, query_generation_prompt
 
 
 class QueryGenerationOutput(BaseModel):
     queries: list[str] = Field(..., description="検索クエリのリスト")
 
 
-_query_generation_prompt_template = """\
-質問に対してベクターデータベースから関連文書を検索するために、
-3つの異なる検索クエリを生成してください。
-距離ベースの類似性検索の限界を克服するために、
-ユーザーの質問に対して複数の視点を提供することが目標です。
-
-質問: {question}
-"""
-
-
-_generate_answer_prompt_template = '''
-以下の文脈だけを踏まえて質問に回答してください。
-
-文脈: """
-{context}
-"""
-
-質問: {question}
-'''
-
-
-@traceable
+@weave.op
 def _reciprocal_rank_fusion(
     retriever_outputs: list[list[Document]],
     k: int = 60,
@@ -75,15 +55,15 @@ def __init__(self, model: BaseChatModel):
         )
         self.retriever = vector_store.as_retriever(search_kwargs={"k": 5})
 
-    @traceable(name="rag_fusion", reduce_fn=reduce_fn)
+    @weave.op(name="rag_fusion")
     def stream(self, question: str) -> Generator[Context | AnswerToken, None, None]:
         # 検索クエリを生成する
-        query_generation_prompt = _query_generation_prompt_template.format(
+        query_generation_prompt_text = query_generation_prompt.format(
             question=question
         )
         model_with_structure = self.model.with_structured_output(QueryGenerationOutput)
         query_generation_output: QueryGenerationOutput = model_with_structure.invoke(
-            query_generation_prompt
+            query_generation_prompt_text
         )  # type: ignore[assignment]
 
         # 検索する
@@ -95,11 +75,11 @@ def stream(self, question: str) -> Generator[Context | AnswerToken, None, None]:
         yield Context(documents=documents)
 
         # 回答を生成して徐々に応答を返す
-        generate_answer_prompt = _generate_answer_prompt_template.format(
+        generate_answer_prompt_text = generate_answer_prompt.format(
             context=documents,
             question=question,
         )
-        for chunk in self.model.stream(generate_answer_prompt):
+        for chunk in self.model.stream(generate_answer_prompt_text):
             yield AnswerToken(token=chunk.content)
 
 

diff --git a/app/advanced_rag/chains/rerank.py b/app/advanced_rag/chains/rerank.py
@@ -2,26 +2,17 @@
 from typing import Generator, Sequence
 
 import cohere
+import weave
 from langchain.embeddings import init_embeddings
 from langchain_chroma import Chroma
 from langchain_core.documents import Document
 from langchain_core.language_models import BaseChatModel
-from langsmith import traceable
 
-from app.advanced_rag.chains.base import AnswerToken, BaseRAGChain, Context, reduce_fn
+from app.advanced_rag.chains.base import AnswerToken, BaseRAGChain, Context, WeaveCallId
+from app.prompts import generate_answer_prompt
 
-_generate_answer_prompt_template = '''
-以下の文脈だけを踏まえて質問に回答してください。
 
-文脈: """
-{context}
-"""
-
-質問: {question}
-'''
-
-
-@traceable
+@weave.op
 def _rerank(
     question: str, documents: Sequence[Document], top_n: int
 ) -> Sequence[Document]:
@@ -57,8 +48,13 @@ def __init__(self, model: BaseChatModel):
         )
         self.retriever = vector_store.as_retriever(search_kwargs={"k": 20})
 
-    @traceable(name="rerank", reduce_fn=reduce_fn)
-    def stream(self, question: str) -> Generator[Context | AnswerToken, None, None]:
+    @weave.op(name="rerank")
+    def stream(
+        self, question: str
+    ) -> Generator[Context | AnswerToken | WeaveCallId, None, None]:
+        current_call = weave.require_current_call()
+        yield WeaveCallId(weave_call_id=current_call.id)
+
         # 検索する
         retrieved_documents = self.retriever.invoke(question)
         # リランクする
@@ -67,7 +63,7 @@ def stream(self, question: str) -> Generator[Context | AnswerToken, None, None]:
         yield Context(documents=documents)
 
         # 回答を生成して徐々に応答を返す
-        prompt = _generate_answer_prompt_template.format(
+        prompt = generate_answer_prompt.format(
             context=documents,
             question=question,
         )