最近中文字幕免费在线看,在教室伦流澡到高潮h,中国gay男男gaygay视频,在线 | 一区二区三区四区,再深点灬舒服灬太大了添gif

更新于 5月10日

大模型深度學(xué)習(xí)工程師(微調(diào)與優(yōu)化方向)

3-4.5萬
  • 北京東城區(qū)
  • 3-5年
  • 碩士
  • 全職
  • 招1人

職位描述

Python在線醫(yī)療人工智能
崗位職責(zé): 1. 模型開發(fā)與微調(diào) - 負(fù)責(zé)大模型(如Qwen、DeepSeek、LLaMA)的定制化開發(fā),針對中醫(yī)場景(如問診記錄分析、方劑推薦)進(jìn)行參數(shù)高效微調(diào)(如LoRA、Adapter、QLoRA); - 設(shè)計并實現(xiàn)模型優(yōu)化方案(如FP8/INT8量化、動態(tài)批處理),提升推理效率與部署性能。 - 結(jié)合業(yè)務(wù)需求(如HIS系統(tǒng)集成),開發(fā)智能功能(如舌診圖像分析、中藥配伍規(guī)則建模)。
2. 全流程模型管理 - 主導(dǎo)模型從數(shù)據(jù)預(yù)處理、訓(xùn)練、評估到部署的全生命周期管理。 - 構(gòu)建高質(zhì)量垂直領(lǐng)域數(shù)據(jù)集(如中醫(yī)古籍文本、電子病歷),完成數(shù)據(jù)清洗、標(biāo)注與增強。 - 使用DeepSpeed、FSDP等技術(shù)實現(xiàn)分布式訓(xùn)練,優(yōu)化GPU資源利用率。
3. 強化學(xué)習(xí)與對齊技術(shù) - 研究并實現(xiàn) 監(jiān)督微調(diào)(SFT) 與 人類反饋強化學(xué)習(xí)(RLHF) 技術(shù),提升模型對齊用戶需求的能力(如ReFT論文中的強化微調(diào)方法)。 - 設(shè)計 獎勵函數(shù) 和 PPO訓(xùn)練框架,優(yōu)化模型在復(fù)雜任務(wù)中的決策能力(如中醫(yī)辨證論治規(guī)則建模)。 - 探索 在線強化學(xué)習(xí)(Online RL) 和 離線強化學(xué)習(xí)(Offline RL) 在醫(yī)療場景的應(yīng)用。
4. 技術(shù)落地與協(xié)作 - 將微調(diào)模型集成到HIS系統(tǒng),支持智能問診、診療輔助等功能,確保與醫(yī)療業(yè)務(wù)流程無縫對接。 - 與醫(yī)療顧問協(xié)作,驗證模型輸出的合規(guī)性(如中醫(yī)理論規(guī)范、患者隱私保護(hù)) - 輸出技術(shù)文檔與案例,支持客戶培訓(xùn)及技術(shù)方案宣講。
5. 前沿技術(shù)探索 - 跟蹤大模型領(lǐng)域最新研究(如多模態(tài)模型、Agent框架),探索其在醫(yī)療場景的應(yīng)用潛力。 - 研究對齊技術(shù)(如DPO/RLAIF)、RAG(檢索增強生成)等,優(yōu)化模型交互體驗與響應(yīng)質(zhì)量。
職位要求: 1. 學(xué)歷:計算機科學(xué)、人工智能、數(shù)學(xué)或醫(yī)學(xué)相關(guān)專業(yè)碩士及以上學(xué)歷。 2. 經(jīng)驗:3年以上深度學(xué)習(xí)或大模型項目經(jīng)驗,有醫(yī)療AI或NLP項目落地者優(yōu)先。 3. 數(shù)學(xué)基礎(chǔ): - 熟練掌握 線性代數(shù)(矩陣運算、特征值分解)、微積分(梯度下降、優(yōu)化理論)、概率論與統(tǒng)計學(xué)(貝葉斯推斷、假設(shè)檢驗)。 - 理解 馬爾可夫決策過程(MDP)、貝爾曼方程、策略梯度定理 等強化學(xué)習(xí)數(shù)學(xué)基礎(chǔ)。 4. 技術(shù)能力: - 精通PyTorch/TensorFlow框架,熟悉HuggingFace生態(tài)及主流開源模型。 - 掌握參數(shù)高效微調(diào)(PEFT)技術(shù),熟悉LoRA、Adapter等方法。 - 熟悉分布式訓(xùn)練(如DeepSpeed、FSDP)和模型壓縮(如量化、蒸餾)。 - 有醫(yī)療數(shù)據(jù)處理經(jīng)驗(如電子病歷、舌診圖像)或中醫(yī)知識基礎(chǔ)者優(yōu)先。 5. 強化學(xué)習(xí)要求: - 熟悉 監(jiān)督微調(diào)(SFT)、人類反饋強化學(xué)習(xí)(RLHF)、ReFT(Reinforced Fine-Tuning) 等技術(shù)。 - 掌握 PPO(Proximal Policy Optimization)、DQN(Deep Q-Network) 等強化學(xué)習(xí)算法,能獨立實現(xiàn)訓(xùn)練框架。 - 有 在線強化學(xué)習(xí) 或 離線強化學(xué)習(xí) 項目經(jīng)驗,能設(shè)計獎勵函數(shù)并優(yōu)化策略。 6. 工具掌握: - 熟練使用Python。 - 熟悉模型部署技術(shù)(如FastAPI、Triton、vLLM、KTransformers等)。 加分項目: - 對中醫(yī)有一定程度的了解,有中醫(yī)臨床經(jīng)驗,或在中醫(yī)醫(yī)療機構(gòu)中具有工作經(jīng)驗會優(yōu)先錄取。 - 有強化學(xué)習(xí)論文復(fù)現(xiàn)或 ReFT技術(shù)實踐經(jīng)驗。 - 參與過醫(yī)療AI競賽(如Kaggle醫(yī)療挑戰(zhàn))或開源項目貢獻(xiàn)。 - 掌握Docker、Kubernetes等DevOps工具

工作地點

北京東城區(qū)中糧廣場B座

職位發(fā)布者

任女士/公司管理部總監(jiān)

三日內(nèi)活躍
立即溝通
公司Logo北京精醫(yī)和生醫(yī)藥科技有限公司
北京精醫(yī)和生醫(yī)藥科技有限公司,是基于中醫(yī)藥行業(yè)頗具影響力的教育平臺中醫(yī)在線建立的新型中藥研發(fā)企業(yè),也是知名投資機構(gòu)IDG多輪投資的中醫(yī)藥研發(fā)企業(yè),精醫(yī)和生挖掘并開發(fā)出一款治療2型糖尿病的特效中成藥“標(biāo)本逆糖顆?!薄?019年至2022年間,精醫(yī)和生在北京8家醫(yī)院進(jìn)行了400例患者的人用經(jīng)驗回顧性研究,結(jié)果表明,該治療方案比西藥優(yōu)效率高達(dá)92.75%,血糖達(dá)標(biāo)率到達(dá)69.50%,其中51.50%患者甚至可實現(xiàn)中藥、西藥停藥生活,徹底擺脫糖尿病的困擾,打破了糖尿病被視為終身疾病的魔咒。2021年6月-2023年11月,“標(biāo)本逆糖顆?!币言谥袊嗅t(yī)科學(xué)院中藥所完藥理、藥效、急毒、長毒等全部臨床前實驗,于2024年1月在北京獲得京藥制備準(zhǔn)字藥品在京上市。該藥被列為2024年北京市中醫(yī)藥重大專項。目前,精醫(yī)和生正在開展高質(zhì)量IIT及二三期臨床研究,預(yù)計2028年完成國藥準(zhǔn)字新藥的上市。
公司主頁