<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>SSE on Lutong's Homepage</title><link>https://www.elliot98.top/tags/sse/</link><description>Recent content in SSE on Lutong's Homepage</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sun, 17 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://www.elliot98.top/tags/sse/index.xml" rel="self" type="application/rss+xml"/><item><title>AI自主科研案例————SSTNet：当校园网管理员开始抓"AI偷渡客"</title><link>https://www.elliot98.top/post/nic/sstnet-blog/</link><pubDate>Sun, 17 May 2026 00:00:00 +0000</pubDate><guid>https://www.elliot98.top/post/nic/sstnet-blog/</guid><description>&lt;h2 id="故事要从一个幸福的烦恼说起"&gt;故事要从一个&amp;quot;幸福的烦恼&amp;quot;说起&lt;/h2&gt;
&lt;p&gt;如果你是中科大的师生，你一定用过 &lt;a href="https://llm.ustc.edu.cn"&gt;llm.ustc.edu.cn&lt;/a&gt;。&lt;/p&gt;
&lt;p&gt;这个平台为校内师生免费提供 DeepSeek、Qwen、GLM 等主流大模型 API 服务。光 &lt;strong&gt;昨天一天，它就跑掉了 30 亿 tokens&lt;/strong&gt;——注意，是亿，不是万。这个数字还在以肉眼可见的速度增长。&lt;/p&gt;
&lt;p&gt;30 亿 tokens 是什么概念？如果每 token 算半个汉字，那就是 15 亿字的对话——相当于一年的人民日报总字数。&lt;strong&gt;这些流量每天穿梭在我们的校园网里。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;作为网络信息中心的工程师，我每天面对一个灵魂拷问：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;这些 LLM 流量，我们看得见、管得住吗？&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;理想情况是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;✅ 校内师生正常使用，畅通无阻&lt;/li&gt;
&lt;li&gt;✅ 3B（外部人员/程序）偷偷调用被及时发现并拦截&lt;/li&gt;
&lt;li&gt;✅ QoS 上给 LLM 交互做优先级保障（毕竟用户在等 token 一个个蹦出来，延迟高了体验炸裂）&lt;/li&gt;
&lt;li&gt;✅ 敏感数据外泄时能溯源&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;但现实是——&lt;strong&gt;这些都是加密的 HTTPS，你跟普通网页浏览从包头上看一模一样&lt;/strong&gt;。传统的 DPI 被 TLS 堵死，深度学习方案又吃 GPU 吃到流眼泪，根本没法在校园网网关上线速跑。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="那咋办"&gt;那咋办？&lt;/h2&gt;
&lt;p&gt;我开始盯着 tcpdump 出来的 pcap 文件发愣……然后突然发现了一个东西。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;SSE（Server-Sent Events）这个协议，它有个蜜汁特点。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;当你调用 LLM 的流式 API 时，数据不是一股脑儿回来的——它是一个 token、一个 token、一个 token 这样&lt;strong&gt;逐字逐句&lt;/strong&gt;地往回蹦。每个 token 大概 200~800 字节，中间还夹着模型思考的停顿。这个&amp;quot;突突突→停顿→突突突&amp;quot;的模式，在包级别上产生了一种独特的&lt;strong&gt;微突发节奏&lt;/strong&gt;——我给它起了个中二的名字叫 &lt;strong&gt;TAP（Token Arrival Process）特征&lt;/strong&gt;。&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;等等，这个故事里怎么好像没提到&amp;quot;我&amp;quot;干了什么？——因为&lt;strong&gt;整个项目都是 AI 自主驱动的。&lt;/strong&gt;&lt;/p&gt;</description></item></channel></rss>