张欣耕 (Shane Zhang)
AI/ML工程师,LLM专家,RAG专家
- 732-491-6378
- [email protected]
- www.shanezhang.com
- 新泽西州皮斯卡塔韦

拥有超过5年经验的AI/ML工程师,专注于微调大型语言模型(LLM)和构建高级代理式检索增强生成(RAG)系统。对AI充满热情,致力于掌握新兴技术以解决现实问题并增强人类创造力。我的梦想是见证第一个通用人工智能(AGI)的发展。我具备将AI模型从实验室带到实际产品的能力,这些产品已触及数百万用户。
Work Experience
AI/ML工程师
花旗集团美国公司 | 2024年8月 - 至今
新泽西州拉瑟福德
- 使用Python构建了快速的结构化数据处理管道,将每份文档的处理时间从10秒减少到1秒以内,文档处理效率提高了90%。
- 使用Python FastAPI设计和加速了一个强大的RESTful API,用于实时数据摄取和NLP处理到Postgres SQL数据库,支持每天超过100万次API调用。
- 使用OpenShift和Apache Spark部署了规模化解决方案,在120天内实现了零停机的CI/CD流程。
- 利用Python和LangChain构建了高级代理式RAG系统和知识图谱(RDF和LPG格式),提高了全球检索的准确性,将AI驱动的合规分析的F1分数从0.32提高到0.71。
- 使用LangChain和RAGAS实现了评估指标和可视化,确保LLM质量,将幻觉率降低了30%,错误调查时间减少了60%。
- 使用OpenAI GPT、Claude和Google Gemini模型,并微调开源LLM模型,开发了定制化和可扩展的代理式RAG系统,每天处理超过20万次API调用。
- 开发了以人为中心的评估框架(RLHF),用于评估LLM在现实场景中的表现,持续确保与2000多名活跃用户的意图保持一致。
- 在AWS上部署了可扩展的AI驱动RAG系统,使用S3、EC2、Glue、Lambda、SageMaker和Bedrock进行高效的数据处理和LLM集成管道。
- 开发并部署了FastAPI接口和gRPC协议,用于在Azure和AWS等云提供商之间进行高效的API集成。
AI/ML工程师
罗伯特·伍德·约翰逊大学医院 | 2023年1月 - 2024年8月
新泽西州新不伦瑞克
- 使用Python、NumPy、Pandas、JavaScript、SQL和Chroma向量数据库设计、构建并部署了一个代理式RAG系统,自动化解析和总结了超过5000份研究文档。
- 使用OpenAI和React框架构建了一个高级代理式RAG系统,将入职时间减少了50%,研究效率提高了40%。
- 与15名学术研究人员组成的跨职能团队合作,将200多个反馈点整合到NLP系统中,使平台与当前和未来的研究目标保持一致。
- 每月为10多名员工举办ML使用研讨会,实现了80%的ML增强工作流程在组织中的采用率。
- 使用AWS SageMaker进行模型微调,并使用AWS Bedrock在生产环境中提供服务。
机器学习工程师
Fiskkit公司 | 2020年1月 - 2021年7月
加利福尼亚州旧金山
- 使用Python PyTorch(C++ CUDA)将NLP驱动的功能集成到Node.js后端,实现了实时文本生成和摘要功能,响应时间减少了70%。
- 使用Python PySpark、NumPy和Pandas进行数据预处理和数据探索,确保高质量的数据集成,使用PyTorch分布式将模型训练结果提高了20%。
- 通过TensorRT的量化和剪枝技术优化了深度学习模型,推理延迟减少了40%。
- 使用Neo4j和Cypher查询构建了一个语义图数据库,用于存储和查询复杂关系,数据检索效率提高了60%。
Projects
企业级RAG系统
花旗集团
使用LangChain、pgvector和AWS Bedrock构建了一个用于金融文档分析的综合RAG系统
Python
FastAPI
LangChain
Postgres
pgvector
AWS Bedrock
Publications
出版物
- Berns, M. P., Nunez, G. M., Zhang, X., et al. (2024年9月). 永久性噪声性听力损失后的听觉决策缺陷。
© 2025 张欣耕. 版权所有。