DeepSeek发布首代推理模型DeepSeek-R1DeepSeek近日发布了其首代推理模型DeepSeek-R1。DeepSeek-R1在数学、代码和推理任务上表现优异,与OpenAI-o1模型相当。
DeepSeek还开源了DeepSeek-R1-Zero、DeepSeek-R1及六个基于Llama和Qwen的蒸馏模型,其中DeepSeek-R1-Distill-Qwen-32B在多个基准测试中超越OpenAI-o1-mini,创下密集模型的新纪录。
Github📮投稿 ☘️频道 🌸聊天