Shihanmax's blog
Timeline
2024
2024-08-01: 《GPU高性能编程CUDA实战(CUDA By Example)》阅读笔记 合集2024-04-27: 算法工程基础 笔记
2024-04-11: 大模型推理中的KVCache技术
2024-03-23: Decoder-only模型的参数与计算量分析
2023
2023-09-16: 语言模型中的tokenizer2023-07-06: 强化学习的数学基础 Lecture 1: Basic Concepts in RL
2023-06-28: 强化学习的数学基础 Lecture 0: Introduction
2023-06-27: 强化学习的数学基础 Lecture -1: Prefix
2023-01-04: Non-parametric masked language modeling
2022
2022-05-29: Paper Reading小结2022-05-22: Transformers and GNN
2022-05-08: 文本的表示
2022-05-02: 概率图模型
2022-04-04: Python中的模块、包、库与导入相关
2021
2021-12-26: ONNX小记2021-12-19: 20211218
2021-10-03: 实体、关系标注工具brat的使用
2021-06-25: 一种使用Copy机制进行关系抽取的思路
2021-05-17: 知识图谱
2021-04-09: 调研:GAN用于文本生成
2021-04-03: SVM从入门到发疯
2021-03-28: XGBoost理解
2021-03-04: 文本生成概览
2021-02-27: 集成学习小结
2020
2020-11-25: 优化算法2020-11-06: 学习率和batch size讨论
2020-09-25: On Sentence Embedding
2020-09-23: 多模态学习
2020-08-16: MLE & MAP
2020-08-10: Derivation of EM
2020-08-05: 正则化
2020-05-11: 序列标注实践
2020-02-26: 动态时间规整(DTW)算法
2019
2019-08-23: How Transferable Are Features In Deep Neural Networks2019-06-21: 毕业旅行小记
2019-03-28: 语义相似度
2019-03-26: Recent Advances In Conversational NLP
2019-03-19: 逻辑回归(Logistic Regression)
2019-03-19: 使用Tensotflow同时加载多个模型
2019-01-25: RNN Training Tips and Tricks
2018
2018-12-22: CRF,HMM,MEMM的区别和联系2018-12-19: 朴素贝叶斯
2018-11-23: Elasticsearch初探
2018-10-25: 海量数据之随机选取
2018-10-15: Java通过JNI调用C库
2018-10-10: Python垃圾回收机制(GC)
2018-10-02: Python元类(MetaClass)