Qdrant向量数据库操作指南查询搜索
1.查询数据入口
query = {"text":"""腾讯财报利润"""}
2.大文本必须切分,根据embedding model大小跟需要chunk
def to_splitter(content):
doc_splitter = RecursiveCharacterTextSplitter(chunk_size=256, chunk_overlap=0)
split_text = doc_splitter.split_text(content["text"])
return split_text
3.embedding化
def to_embeddings(items):
#embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-mpnet-base-v2")
#embeddings = HuggingFaceEmbeddings(model_name="shibing624/text2vec-base-chinese")
sentence_embeddings = HuggingFaceEmbeddings(model_name="GanymedeNil/text2vec-large-chinese")
return sentence_embeddings.embed_documents(items)
4.向量检索
def search(query):
client = QdrantClient("*****", port=6333)
collection_name = "test_collection"
# 过滤条件
query_filter = Filter(
must=[
FieldCondition(
key="collect_type",
match=MatchValue(value="news", ),
)
])
"""
# 单查询搜索
search_result = client.search(
collection_name=collection_name,
query_vector=query[0],
# query_filter=query_filter,
limit=3,
search_params={"exact": False, "hnsw_ef": 128},
with_payload=True,
# with_vectors=True
)
"""
#batch相似度搜索
search_queries = [SearchRequest(vector=search,
#filter=query_filter,
limit=3,
with_payload=True,
search_params={"exact": False, "hnsw_ef": 128}
)
for search in query]
search_result = client.search_batch(
collection_name=collection_name,
requests=search_queries
)
print(search_result)
answers = []
tags = []
"""
注意前端提示词的长度限制
"""
text_append = ""
for result in search_result:
for r in result:
if len(r.payload["text"]) > 512:
text = r.payload["text"][:512]
else:
text = r.payload["text"]
text_append+=text
answers.append({"text": text_append})
return answers
2022年最后一个假期倒计时三天!到底哪里可以安心出游?还有3天就是国庆节啦!据此前国务院办公厅发布的放假安排10月1日至7日放假调休,共7天不过比较让人痛苦的是10月8日(星期六)10月9日(星期日)上班也就是说国庆节之后的那周要连上
不经意出现色斑怎么办医格仕祛斑分享色斑处理技巧色斑不仅是影响女性颜值的问题,也是一个复杂的皮肤问题。很多人处理色斑时盲目的使用祛斑产品和方法,导致成效甚微,甚至可能因为胡乱使用影响到皮肤的健康。那么不经意出现色斑怎么办?医格仕
男士女士用香法则,一篇教你搞定不同用香场景作为一名闻过也用过许许多多香水的帅小伙,回想起和一个人初次见面擦肩而过的瞬间,除了她真的是颜值爆表之外,往往是被她身上的香味吸引,回头多看一眼。一个人身上的香味真的能体现出许多东西
行走的荷尔蒙,木质调中性香魅姬进口美妆大牌小样集合店TF烟木烟氲圣木前调秘鲁圣木紫罗兰叶焚香,黑胡椒中调劳丹脂纸莎草玫瑰刺槐皮革汁后调黑檀愈创木树脂刚刚上市不久的T烟木是喜爱小众香水爱好者的选择,香气复杂的层次值得细细的回味,南美圣
油价降了根据国家发改委消息,新一轮成品油调价窗口将于今天(9月21日)24时开启。据国家发改委价格监测中心监测,本轮成品油调价周期内(9月6日9月20日)国际油价大幅下降。平均来看,伦敦布
即将上线!咸阳统一广场龙柱喷泉视觉盛宴来了9月22日记者从咸阳湖管理处获悉咸阳湖景区统一广场龙柱喷泉升级改造工程安装工作已全部完成目前正在进行喷泉联动试运行调试该工程自今年3月底正式启动实施,主要针对广场东西水系8根龙柱原
落实部省战略合作协议暨山西省有机旱作农业现场推进会召开贺天才陈友权出席并讲话丁永平出席刘志杰主持并讲话朱晓东出席并致辞张强出席并作交流发言王庆锁宣布专业委员会成立并揭牌推进会现场。范涛摄9月21日,落实部省战略合作协议暨全省有机旱作农
程泰宁院士杭州西站是中国新一代火车站在杭州城西,腾起一朵巨型云朵。古朴厚重方中取圆的云门,整体如良渚玉琮纹饰般细致绵密,顶部设计形如虫洞,彰显了充满科技感的杭州城市底蕴。站房被誉为云端候车厅,庞大的云顶由小三角形结构
iOS16。0。2别乱升级,仅3款iPhone续航提升,这3部建议再等等iOS16。0。2已经正式发布,之前因为iOS16发布之后,不少iPhone用户表示升级之后续航表现不行,而且手机存在多个bug。于是苹果火速发布了iOS16。0。2,据称这个版本
俄罗斯反恐永远的痛别斯兰人质事件众所周知CS系列游戏的背景是各国特种部队的反恐行动,这点从游戏内T和CT两阵营角色的诸多现实原型也能看出。但游戏毕竟是游戏,它无法展现出现实世界反恐的残酷。事实上真实的反恐行动要比
还记得宝莲灯里的沉香吗?如今参演底线形似路人要说最近哪部剧最火,靳东成毅主演的现实主义法治剧底线一定榜上有名。人物塑造有血有肉。底线以中国三代法院人发扬法院传帮带的优良传统为纽带,塑造了一批有血有肉有说有笑的法官形象,让法官