中文亚洲爆乳av无码专区,中文字幕日韩一区二区不卡,亚洲欧美另类成人综合图片

登錄/注冊我要招人

400-885-9898

更新于 5月10日

APP

舉報

大模型深度學(xué)習(xí)工程師（微調(diào)與優(yōu)化方向）

3-4.5萬

北京東城區(qū)
3-5年
碩士
全職
招1人

職位描述

Python在線醫(yī)療人工智能

崗位職責(zé)： 1. 模型開發(fā)與微調(diào) - 負(fù)責(zé)大模型（如Qwen、DeepSeek、LLaMA）的定制化開發(fā)，針對中醫(yī)場景（如問診記錄分析、方劑推薦）進(jìn)行參數(shù)高效微調(diào)（如LoRA、Adapter、QLoRA）； - 設(shè)計并實現(xiàn)模型優(yōu)化方案（如FP8/INT8量化、動態(tài)批處理），提升推理效率與部署性能。 - 結(jié)合業(yè)務(wù)需求（如HIS系統(tǒng)集成），開發(fā)智能功能（如舌診圖像分析、中藥配伍規(guī)則建模）。

2. 全流程模型管理 - 主導(dǎo)模型從數(shù)據(jù)預(yù)處理、訓(xùn)練、評估到部署的全生命周期管理。 - 構(gòu)建高質(zhì)量垂直領(lǐng)域數(shù)據(jù)集（如中醫(yī)古籍文本、電子病歷），完成數(shù)據(jù)清洗、標(biāo)注與增強。 - 使用DeepSpeed、FSDP等技術(shù)實現(xiàn)分布式訓(xùn)練，優(yōu)化GPU資源利用率。

3. 強化學(xué)習(xí)與對齊技術(shù) - 研究并實現(xiàn) 監(jiān)督微調(diào)（SFT）與人類反饋強化學(xué)習(xí)（RLHF）技術(shù)，提升模型對齊用戶需求的能力（如ReFT論文中的強化微調(diào)方法）。 - 設(shè)計獎勵函數(shù) 和 PPO訓(xùn)練框架，優(yōu)化模型在復(fù)雜任務(wù)中的決策能力（如中醫(yī)辨證論治規(guī)則建模）。 - 探索在線強化學(xué)習(xí)（Online RL）和離線強化學(xué)習(xí)（Offline RL）在醫(yī)療場景的應(yīng)用。

4. 技術(shù)落地與協(xié)作 - 將微調(diào)模型集成到HIS系統(tǒng)，支持智能問診、診療輔助等功能，確保與醫(yī)療業(yè)務(wù)流程無縫對接。 - 與醫(yī)療顧問協(xié)作，驗證模型輸出的合規(guī)性（如中醫(yī)理論規(guī)范、患者隱私保護(hù)） - 輸出技術(shù)文檔與案例，支持客戶培訓(xùn)及技術(shù)方案宣講。

5. 前沿技術(shù)探索 - 跟蹤大模型領(lǐng)域最新研究（如多模態(tài)模型、Agent框架），探索其在醫(yī)療場景的應(yīng)用潛力。 - 研究對齊技術(shù)（如DPO/RLAIF）、RAG（檢索增強生成）等，優(yōu)化模型交互體驗與響應(yīng)質(zhì)量。

職位要求： 1. 學(xué)歷：計算機科學(xué)、人工智能、數(shù)學(xué)或醫(yī)學(xué)相關(guān)專業(yè)碩士及以上學(xué)歷。 2. 經(jīng)驗：3年以上深度學(xué)習(xí)或大模型項目經(jīng)驗，有醫(yī)療AI或NLP項目落地者優(yōu)先。 3. 數(shù)學(xué)基礎(chǔ)： - 熟練掌握線性代數(shù)（矩陣運算、特征值分解）、微積分（梯度下降、優(yōu)化理論）、概率論與統(tǒng)計學(xué)（貝葉斯推斷、假設(shè)檢驗）。 - 理解馬爾可夫決策過程（MDP）、貝爾曼方程、策略梯度定理等強化學(xué)習(xí)數(shù)學(xué)基礎(chǔ)。 4. 技術(shù)能力： - 精通PyTorch/TensorFlow框架，熟悉HuggingFace生態(tài)及主流開源模型。 - 掌握參數(shù)高效微調(diào)（PEFT）技術(shù)，熟悉LoRA、Adapter等方法。 - 熟悉分布式訓(xùn)練（如DeepSpeed、FSDP）和模型壓縮（如量化、蒸餾）。 - 有醫(yī)療數(shù)據(jù)處理經(jīng)驗（如電子病歷、舌診圖像）或中醫(yī)知識基礎(chǔ)者優(yōu)先。 5. 強化學(xué)習(xí)要求： - 熟悉監(jiān)督微調(diào)（SFT）、人類反饋強化學(xué)習(xí)（RLHF）、ReFT（Reinforced Fine-Tuning）等技術(shù)。 - 掌握 PPO（Proximal Policy Optimization）、DQN（Deep Q-Network）等強化學(xué)習(xí)算法，能獨立實現(xiàn)訓(xùn)練框架。 - 有在線強化學(xué)習(xí) 或離線強化學(xué)習(xí) 項目經(jīng)驗，能設(shè)計獎勵函數(shù)并優(yōu)化策略。 6. 工具掌握： - 熟練使用Python。 - 熟悉模型部署技術(shù)（如FastAPI、Triton、vLLM、KTransformers等）。加分項目： - 對中醫(yī)有一定程度的了解，有中醫(yī)臨床經(jīng)驗，或在中醫(yī)醫(yī)療機構(gòu)中具有工作經(jīng)驗會優(yōu)先錄取。 - 有強化學(xué)習(xí)論文復(fù)現(xiàn)或 ReFT技術(shù)實踐經(jīng)驗。 - 參與過醫(yī)療AI競賽（如Kaggle醫(yī)療挑戰(zhàn)）或開源項目貢獻(xiàn)。 - 掌握Docker、Kubernetes等DevOps工具

工作地點

北京東城區(qū)中糧廣場B座

完善一份簡歷
1736萬+企業(yè)在線搜索，780萬+海量職位精準(zhǔn)推薦

相似職位

并行軟件開發(fā)與優(yōu)化工程師r1.5-2.5萬
北京 - 海淀
中國人民解放軍32806部隊
AI研發(fā)工程師1.5-2萬
北京 - 海淀
藍(lán)星智云(山東)智能科技有限公司
AI大模型訓(xùn)練專家2-3萬
北京 - 石景山
捷安高科
HJ-環(huán)境算法工程師1.5-3萬·13薪
北京 - 昌平
北京萬維盈創(chuàng)科技發(fā)展有限公司
大模型研發(fā)工程師2-3萬
北京 - 昌平
愛多邦(北京)信息技術(shù)服務(wù)有限公司
北京-深度強化學(xué)習(xí)算法工程師3-6萬·14薪
北京 - 海淀
北京思靈機器人科技有限責(zé)任公司

查看更多相似職位

職位發(fā)布者

任女士/公司管理部總監(jiān)

三日內(nèi)活躍

立即溝通

北京精醫(yī)和生醫(yī)藥科技有限公司

北京精醫(yī)和生醫(yī)藥科技有限公司，是基于中醫(yī)藥行業(yè)頗具影響力的教育平臺中醫(yī)在線建立的新型中藥研發(fā)企業(yè)，也是知名投資機構(gòu)IDG多輪投資的中醫(yī)藥研發(fā)企業(yè)，精醫(yī)和生挖掘并開發(fā)出一款治療2型糖尿病的特效中成藥“標(biāo)本逆糖顆?！薄?019年至2022年間，精醫(yī)和生在北京8家醫(yī)院進(jìn)行了400例患者的人用經(jīng)驗回顧性研究，結(jié)果表明，該治療方案比西藥優(yōu)效率高達(dá)92.75%，血糖達(dá)標(biāo)率到達(dá)69.50%，其中51.50%患者甚至可實現(xiàn)中藥、西藥停藥生活，徹底擺脫糖尿病的困擾，打破了糖尿病被視為終身疾病的魔咒。2021年6月-2023年11月，“標(biāo)本逆糖顆?！币言谥袊嗅t(yī)科學(xué)院中藥所完藥理、藥效、急毒、長毒等全部臨床前實驗，于2024年1月在北京獲得京藥制備準(zhǔn)字藥品在京上市。該藥被列為2024年北京市中醫(yī)藥重大專項。目前，精醫(yī)和生正在開展高質(zhì)量IIT及二三期臨床研究，預(yù)計2028年完成國藥準(zhǔn)字新藥的上市。

公司主頁