https://t.me/s/moreality🌐 一些本人的碎碎念,汇聚了几个主要的日常分享渠道📝 内容包括但不限于:🏃 日常生活,👨💻 工具分享,📖 书影音,体育赛事(⚽️曼城球迷)💡 所有内容均为在曾经某一时刻的观点。
#mark #claude #gpt #deepseek #ai
手动查了下目前几个常见 LLM API 的官方价格差异 (输入均为缓存未命中价格):
1 - Claude 3.5 Sonnet
ref: https://www.anthropic.com/pricing?t#anthropic-api
● 输入成本: $3.00 每百万个令牌
● 输出成本: $15.00 每百万个令牌
2 - OpenAI GPT-4o
ref: https://openai.com/api/pricing/?t
● 输入成本: $2.50 每百万个令牌
● 输出成本: $10.00 每百万个令牌
3 - DeepSeek
ref: https://api-docs.deepseek.com/zh-cn/quick_start/pricing
● 输入成本: ¥2 每百万个令牌 (2025-02-08 后, 目前是1元, 下同)
● 输出成本: ¥8 每百万个令牌 (目前是2元)
via Memos
手动查了下目前几个常见 LLM API 的官方价格差异 (输入均为缓存未命中价格):
1 - Claude 3.5 Sonnet
ref: https://www.anthropic.com/pricing?t#anthropic-api
● 输入成本: $3.00 每百万个令牌
● 输出成本: $15.00 每百万个令牌
2 - OpenAI GPT-4o
ref: https://openai.com/api/pricing/?t
● 输入成本: $2.50 每百万个令牌
● 输出成本: $10.00 每百万个令牌
3 - DeepSeek
ref: https://api-docs.deepseek.com/zh-cn/quick_start/pricing
● 输入成本: ¥2 每百万个令牌 (2025-02-08 后, 目前是1元, 下同)
● 输出成本: ¥8 每百万个令牌 (目前是2元)
via Memos
#mark #gpt #leaderboard
● https://evalplus.github.io/leaderboard.html
一个专门评测 AI coding 的 LLM 评测
via Memos
● https://evalplus.github.io/leaderboard.html
一个专门评测 AI coding 的 LLM 评测
via Memos
#gpt #claude #tools
一个将 github repo 打包成单个 txt / xml / markdown 等纯文本文件的工具:
众所周知 claude project 支持的文本类型包括:
● PDF
● DOCX
● CSV
● TXT
● HTML
● ODT
● RTF
● EPUB
● JSON
因此通过 repomix 可以直接让 claude 在 projects 中分析单个仓库的所有代码.
via Memos
一个将 github repo 打包成单个 txt / xml / markdown 等纯文本文件的工具:
repomix (原名叫 repopack): https://github.com/yamadashy/repomix众所周知 claude project 支持的文本类型包括:
● DOCX
● CSV
● TXT
● HTML
● ODT
● RTF
● EPUB
● JSON
因此通过 repomix 可以直接让 claude 在 projects 中分析单个仓库的所有代码.
via Memos
#gpt #test
一个有意思的 GPT 测试问题:
答案是
测试时间:
本问题通过的模型:
失败的模型:
偶尔成功的模型:
其中 claude 3.5 sonnet 和 gpt 4o 都是通过准确的代码执行穷举出正确解.
而 gemini 1.5 pro / gemini exp 1206 虽然近期排名高, 但是还是输出了超长一段文本, 然后多次给出错误回复, 十次只有一两次给出了正确解
Update: 如果明确指出需要「通过运行程序给出答案」, 并且开启 gemini 的 code execution, 也是可以得到正确解的, 但是如果仅仅开启 code execution, 不在问题中指出需要程序解, 那么 gemeni 还是不会主动给出代码并执行
via Memos
Invalid media: image
一个有意思的 GPT 测试问题:
小李在纸上写了一个四位数A,把A的个位数字移到首位,得到另一个四位数 B,最后把A和B加起来得到和数C,并且C也是一个四位数。
已知A的各位数字之和是20,C的百位和十位数学分别是0和4。
那么C代表的四位数是?
答案是
8041测试时间:
2024-12-09本问题通过的模型:
claude 3.5 sonnet, gpt-4o (官网未降智)失败的模型:
gpt-4o (API), gemini-1.5-pro-latest偶尔成功的模型:
gemini-exp-1206其中 claude 3.5 sonnet 和 gpt 4o 都是通过准确的代码执行穷举出正确解.
而 gemini 1.5 pro / gemini exp 1206 虽然近期排名高, 但是还是输出了超长一段文本, 然后多次给出错误回复, 十次只有一两次给出了正确解
Update: 如果明确指出需要「通过运行程序给出答案」, 并且开启 gemini 的 code execution, 也是可以得到正确解的, 但是如果仅仅开启 code execution, 不在问题中指出需要程序解, 那么 gemeni 还是不会主动给出代码并执行
问题来源: https://linux.do/t/261827/32
via Memos
Invalid media: image
#llm #gpt #claude #gemini
google 的 gemini 居然登顶了..
看来下周要体验一下了.
而且 free plan 居然这么有诚意
● 使用 & 介绍: https://aistudio.google.com/app/plan_information
● 更新日志: https://ai.google.dev/gemini-api/docs/changelog?hl=zh-cn
memos/gCMhr54XZ7T79zoAemRzry
via Memos
google 的 gemini 居然登顶了..
看来下周要体验一下了.
而且 free plan 居然这么有诚意
● 使用 & 介绍: https://aistudio.google.com/app/plan_information
● 更新日志: https://ai.google.dev/gemini-api/docs/changelog?hl=zh-cn
memos/gCMhr54XZ7T79zoAemRzry
via Memos
#claude #gpt
关于 claude pro 的 token 限制:
● About Claude Pro usage
也就是说大约每 5 小时可以聊天 45 句, 并且单次上下文限制在 200 个 15 个英文单词左右的句子.
官方提出的建议 How can I maximize my Claude Pro usage?
1. 尽可能每次用新对话提问题, Claude也会对简短的对话更快地做出回应。
2. 一次性提出多个问题,尤其是当你想问Claude关于长文档的问题时。因为每次你发送新的消息,Claude都需要重新阅读对话,所以将问题分开在单独的消息中提出会比包含多个问题的单条消息更快地耗尽你的限制。
3. 不要重新上传文件。Claude可以看到你对话中的整个上下文,所以你不需要多次上传相同的文件(除非你开始新的对话)。
claude 文档 (中文): https://docs.anthropic.com/zh-CN/docs/welcome
via Memos
关于 claude pro 的 token 限制:
● About Claude Pro usage
也就是说大约每 5 小时可以聊天 45 句, 并且单次上下文限制在 200 个 15 个英文单词左右的句子.
官方提出的建议 How can I maximize my Claude Pro usage?
1. 尽可能每次用新对话提问题, Claude也会对简短的对话更快地做出回应。
2. 一次性提出多个问题,尤其是当你想问Claude关于长文档的问题时。因为每次你发送新的消息,Claude都需要重新阅读对话,所以将问题分开在单独的消息中提出会比包含多个问题的单条消息更快地耗尽你的限制。
3. 不要重新上传文件。Claude可以看到你对话中的整个上下文,所以你不需要多次上传相同的文件(除非你开始新的对话)。
claude 文档 (中文): https://docs.anthropic.com/zh-CN/docs/welcome
via Memos
#mark #gpt #leaderboard
● https://lmarena.ai/?leaderboard
LLM Model 排行榜:
via Memos
● https://lmarena.ai/?leaderboard
LLM Model 排行榜:
Chatbot Arena (lmarena.ai) 是由加州大学伯克利分校 SkyLab 和 LMSYS 开发的开源平台,用于通过人类偏好评估 AI。该平台通过超过 100 万次用户投票,使用 Bradley-Terry 模型生成实时排行榜,以评选最佳 LLM 和 AI 聊天机器人。
via Memos
#gpt
claude 新模型: claude 3.5 haiku
● https://www.anthropic.com/news/3-5-models-and-computer-use
via Memos
Invalid media: image
claude 新模型: claude 3.5 haiku
● https://www.anthropic.com/news/3-5-models-and-computer-use
via Memos
Invalid media: image
#mark #claude #gpt #deepseek #ai
手动查了下目前几个常见 LLM API 的官方价格差异 (输入均为缓存未命中价格):
1 - Claude 3.5 Sonnet
ref: https://www.anthropic.com/pricing?t#anthropic-api
● 输入成本: $3.00 每百万个令牌
● 输出成本: $15.00 每百万个令牌
2 - OpenAI GPT-4o
ref: https://openai.com/api/pricing/?t
● 输入成本: $2.50 每百万个令牌
● 输出成本: $10.00 每百万个令牌
3 - DeepSeek
ref: https://api-docs.deepseek.com/zh-cn/quick_start/pricing
● 输入成本: ¥2 每百万个令牌 (2025-02-08 后, 目前是1元, 下同)
● 输出成本: ¥8 每百万个令牌 (目前是2元)
via Memos
手动查了下目前几个常见 LLM API 的官方价格差异 (输入均为缓存未命中价格):
1 - Claude 3.5 Sonnet
ref: https://www.anthropic.com/pricing?t#anthropic-api
● 输入成本: $3.00 每百万个令牌
● 输出成本: $15.00 每百万个令牌
2 - OpenAI GPT-4o
ref: https://openai.com/api/pricing/?t
● 输入成本: $2.50 每百万个令牌
● 输出成本: $10.00 每百万个令牌
3 - DeepSeek
ref: https://api-docs.deepseek.com/zh-cn/quick_start/pricing
● 输入成本: ¥2 每百万个令牌 (2025-02-08 后, 目前是1元, 下同)
● 输出成本: ¥8 每百万个令牌 (目前是2元)
via Memos
#gpt #claude #tools
一个将 github repo 打包成单个 txt / xml / markdown 等纯文本文件的工具:
众所周知 claude project 支持的文本类型包括:
● PDF
● DOCX
● CSV
● TXT
● HTML
● ODT
● RTF
● EPUB
● JSON
因此通过 repomix 可以直接让 claude 在 project 中分析单个仓库的所有代码.
via Memos
一个将 github repo 打包成单个 txt / xml / markdown 等纯文本文件的工具:
repomix (原名叫 repopack): https://github.com/yamadashy/repomix众所周知 claude project 支持的文本类型包括:
● DOCX
● CSV
● TXT
● HTML
● ODT
● RTF
● EPUB
● JSON
因此通过 repomix 可以直接让 claude 在 project 中分析单个仓库的所有代码.
via Memos
#claude #gpt
关于 claude pro 的 token 限制:
● https://support.anthropic.com/en/articles/8324991-about-claude-pro-usage
也就是说大约每 5 小时可以聊天 45 句, 并且单次上下文限制在 200 个 15 个英文单词左右的句子.
官方提出的建议 How can I maximize my Claude Pro usage?:
1. 尽可能每次用新对话提问题, Claude也会对简短的对话更快地做出回应。
2. 一次性提出多个问题,尤其是当你想问Claude关于长文档的问题时。因为每次你发送新的消息,Claude都需要重新阅读对话,所以将问题分开在单独的消息中提出会比包含多个问题的单条消息更快地耗尽你的限制。
3. 不要重新上传文件。Claude可以看到你对话中的整个上下文,所以你不需要多次上传相同的文件(除非你开始新的对话)。
via Memos
关于 claude pro 的 token 限制:
● https://support.anthropic.com/en/articles/8324991-about-claude-pro-usage
也就是说大约每 5 小时可以聊天 45 句, 并且单次上下文限制在 200 个 15 个英文单词左右的句子.
官方提出的建议 How can I maximize my Claude Pro usage?:
1. 尽可能每次用新对话提问题, Claude也会对简短的对话更快地做出回应。
2. 一次性提出多个问题,尤其是当你想问Claude关于长文档的问题时。因为每次你发送新的消息,Claude都需要重新阅读对话,所以将问题分开在单独的消息中提出会比包含多个问题的单条消息更快地耗尽你的限制。
3. 不要重新上传文件。Claude可以看到你对话中的整个上下文,所以你不需要多次上传相同的文件(除非你开始新的对话)。
via Memos