张欣耕 (Shane Zhang)
AI/ML工程师,LLM专家,RAG专家
- 732-491-6378
- [email protected]
- www.shanezhang.com
- 新泽西州皮斯卡塔韦

拥有超过5年经验的AI/ML工程师,专注于微调大型语言模型(LLM)和构建高级代理式检索增强生成(RAG)系统。对AI充满热情,致力于掌握新兴技术以解决现实问题并增强人类创造力。我的梦想是见证第一个通用人工智能(AGI)的发展。我具备将AI模型从实验室带到实际产品的能力,这些产品已触及数百万用户。
Work Experience
AI/ML工程师
新泽西州拉瑟福德
- 使用Python构建了快速的结构化数据处理管道,将每份文档的处理时间从10秒减少到1秒以内,文档处理效率提高了90%。
- 使用Python FastAPI设计和加速了一个强大的RESTful API,用于实时数据摄取和NLP处理到Postgres SQL数据库,支持每天超过100万次API调用。
- 使用OpenShift和Apache Spark部署了规模化解决方案,在120天内实现了零停机的CI/CD流程。
- 利用Python和LangChain构建了高级代理式RAG系统和知识图谱(RDF和LPG格式),提高了全球检索的准确性,将AI驱动的合规分析的F1分数从0.32提高到0.71。
- 使用LangChain和RAGAS实现了评估指标和可视化,确保LLM质量,将幻觉率降低了30%,错误调查时间减少了60%。
- 使用OpenAI GPT、Claude和Google Gemini模型,并微调开源LLM模型,开发了定制化和可扩展的代理式RAG系统,每天处理超过20万次API调用。
- 开发了以人为中心的评估框架(RLHF),用于评估LLM在现实场景中的表现,持续确保与2000多名活跃用户的意图保持一致。
- 在AWS上部署了可扩展的AI驱动RAG系统,使用S3、EC2、Glue、Lambda、SageMaker和Bedrock进行高效的数据处理和LLM集成管道。
- 开发并部署了FastAPI接口和gRPC协议,用于在Azure和AWS等云提供商之间进行高效的API集成。
AI/ML工程师
新泽西州新不伦瑞克
- 使用Python、NumPy、Pandas、JavaScript、SQL和Chroma向量数据库设计、构建并部署了一个代理式RAG系统,自动化解析和总结了超过5000份研究文档。
- 使用OpenAI和React框架构建了一个高级代理式RAG系统,将入职时间减少了50%,研究效率提高了40%。
- 与15名学术研究人员组成的跨职能团队合作,将200多个反馈点整合到NLP系统中,使平台与当前和未来的研究目标保持一致。
- 每月为10多名员工举办ML使用研讨会,实现了80%的ML增强工作流程在组织中的采用率。
- 使用AWS SageMaker进行模型微调,并使用AWS Bedrock在生产环境中提供服务。
机器学习工程师
加利福尼亚州旧金山
- 使用Python PyTorch(C++ CUDA)将NLP驱动的功能集成到Node.js后端,实现了实时文本生成和摘要功能,响应时间减少了70%。
- 使用Python PySpark、NumPy和Pandas进行数据预处理和数据探索,确保高质量的数据集成,使用PyTorch分布式将模型训练结果提高了20%。
- 通过TensorRT的量化和剪枝技术优化了深度学习模型,推理延迟减少了40%。
- 使用Neo4j和Cypher查询构建了一个语义图数据库,用于存储和查询复杂关系,数据检索效率提高了60%。
Projects
企业级RAG系统
使用LangChain、pgvector和AWS Bedrock构建了一个用于金融文档分析的综合RAG系统
医疗研究助手
使用OpenAI API、向量数据库和React为医学研究人员开发了一个AI助手
NLP文本分析平台
使用Node.js后端和PyTorch模型创建了一个NLP驱动的文本分析平台
Information
出版物
- Berns, M. P., Nunez, G. M., Zhang, X., et al. (2024年9月). 永久性噪声性听力损失后的听觉决策缺陷。
Education
-
计算机科学硕士,机器学习专业新泽西州立大学罗格斯分校2020年12月 - 2022年12月
-
计算机科学学士新泽西州立大学罗格斯分校2017年9月 - 2020年9月
Skills
生成式AI
LLM微调
参数高效微调 (PEFT)
检索增强生成 (RAG)
代理式RAG系统
知识图谱 (RDF)
知识图谱 (LPG格式)
GraphRAG
OpenAI GPT
Google Gemini
Anthropic Claude
LangChain
LangGraph
提示工程
RLHF
机器学习与NLP
PyTorch
TensorFlow
Keras
Transformers
HuggingFace
自然语言处理 (NLP)
spaCy
NLTK
特征工程
统计建模
量化
剪枝技术
模型评估
性能分析
神经网络
GANs
Stable Diffusion
数据工程
Postgres with pgvector
FAISS
Chroma
Neo4j
Cypher
MySQL
PostgreSQL
Oracle
Elasticsearch
MongoDB
PySpark
Pandas
NumPy
Apache Spark
Hadoop
ETL工作流
数据处理管道
编程
Python
FastAPI
Streamlit
PyTest
JavaScript
Node.js
React
Scala
Java
C++
REST API开发
gRPC
JWT
认证系统
DevOps与MLOps
Docker
Kubernetes
OpenShift
CI/CD管道
开发工作流
AWS SageMaker
AWS Bedrock
AWS S3
AWS EC2
AWS Lambda
AWS Glue
Azure云服务
MLflow
RAGAS
专业与软技能
技术沟通
文档编写
团队协作
跨职能领导
利益相关者管理
客户演示
指导
培训
敏捷方法论
项目管理
Languages
- 英语 (母语,流利)
- 中文 (母语,流利)
Interests
生成式AI
潜水
阅读
哲学
心理学
社会学