佛得角大海豹的博客

“学习”

HuggingFace T5 关于 prune_heads 方法的 bug

时效性:2023-07-26。transformers库版本:4.29.0 ~ 4.31.0 GitHub 关于此问题有讨论。 transformers.models.t5.modeling_t...

离散数学 - 课堂笔记

离散数学 笔者按:本文为笔者本科课程所作课堂笔记。学知所限,或有谬误,万望不吝斧正。 另,本文中10.1一节用到mermaid代码,本页不能正常渲染。 参考书:《离散数学及其应用》(第三版...