# 一文读懂 Web 安全
Web 安全是互联网中不可或缺的一个领域,这个领域中诞生了大量的黑帽子与白帽子,他们都是安全领域的王者,在平时里,他们利用各种巧妙的技术互相博弈,时不时就会掀起一场 Web 安全浪潮,真可谓神仙打架,各显神通。
本文从一个吃瓜群众的角度,聊一聊 Web 安全的一些有趣故事。
- 安全世界观
- 安全攻防案例
- 总结与思考
# 安全世界观
在互联网发展之初,IE 浏览器垄断的时期,大家上网的目的都很单纯,主要通过浏览器分享信息,获取新闻。但随着互联网的不断发展发展,一个网页能做的事情越来越多,除了看新闻,我们还可以看视频、玩游戏、购物、聊天等,这些功能都大大丰富了我们的生活。
随着网页功能的逐渐增多,就开始出现了一些黑帽子,他们试图通过一些技术手段来牟取利益。在我小的时候,印象最深的就是木马病毒,它可以监控你的键盘,将你在键盘上敲打的内容发送到黑客的机器上,黑客通过分析这些内容,很容易就能得到你的游戏账号和密码。
在这之后,就诞生出了一些杀毒软件,致力于解决网络上的各种病毒,随着不断地发展,杀毒软件已经成为一台电脑必不可少的软件。
为什么会出现这样的安全问题?
安全归根到底是信任的问题,如果所有人都按照正常的流程去上网,不去谋取私利,也就没有安全问题可谈了。
安全的根本在于信任,但要让所有人互相信任谈何容易。在当前阶段,我们可以做到:持续做好安全防护,让漏洞越来越少,非法攻击越来越困难,这样就能逐渐减少黑帽子的数量,让病毒制造者越来越少。
# 如何做好安全
要做好安全,首先得理解安全问题的属性,前人通过无数实践,最后将安全的属性总结为安全三要素,分别为:机密性、完整性、可用性。
- 机密性
- 保护数据内容不被泄露。
- 通常使用加密的方法。
- 完整性
- 保护数据内容是完整的、没有被篡改。
- 通常使用数字签名的方法。
- 可用性
- 数据随时都能够使用。
- 通常是在防御 DOS。
有了安全 3 要素之后,我们就可以对安全问题进行评估了。
- 资产等级划分
- 找出最重要的数据。
- 找出最重要数据的宿主空间,如:在数据库里,那么数据库就得重点防御。
- 找出数据库的宿主空间,如:在一台服务器上,那么这台服务器就得做次等防御。
- 找出服务器的宿主空间,如:在 OSI 网络层级上,那么在网络层面就得做一般防御。
- 威胁分析
- 找出威胁(可能造成危害的来源)。
- 找出风险(可能出现的损失叫做风险)。
- 风险分析
- 采取多标准决策分析,即:风险 = 威胁等级 * 威胁可行性。
- 计算所有的威胁,将最终的风险进行排序,优先解决风险大的问题。
- 确认解决方案
- 找出不安全的实现方式,并确定解决方案。
- 解决方案不要改变商业需求的初衷。
- 解决方案需对用户透明,不要改变用户的习惯。
做好安全评估之后,我们就有了一份安全解决方案,后续的安全工作只需按照这个方案去做,就没有任何问题。
# 安全的原则
有了安全解决方案之后,我们还可以制定一些安全原则,遵守原则做事,可以让我们事半功倍。
- 黑名单、白名单原则
- 白名单方案指的是给安全的资源授权。
- 黑名单方案指的是禁用不安全的资源。
- 我们应该优先使用白名单方案,因为黑名单通常统计不完所有的不安全资源。
- 如:XSS 攻击的方式非常多,可以通过 script、css、image 标签等,尽管你将这些标签都加入黑名单,也不能保证其他的标签都没有 XSS 的攻击隐患。
- 最小权限原则
- 只授予必要的权限,不要过度授权,减少出错机会。
- 如:普通权限的 Linux 用户只能操作
~
文件夹下的目录,如果有人想删库跑路,在执行rm -rf /
时,就会提示无权限。
- 纵深防御原则
- 这条原则类似
木桶理论
,安全水平往往取决于最短的那块板。 - 即:不要留下短板,黑帽子们往往可以利用短板为突破口,挖掘更大的漏洞。
- 这条原则类似
- 数据与代码分离原则
- 当用户数据被当成代码执行时,混淆了数据和代码的边界,从而导致安全问题。
- 如:XSS 就是利用这一点去攻击的。
- 不可预测性原则
- 这条原则是为了提高攻击门槛,有效防止基于篡改、伪造的攻击。
- 如:数据库中使用 uuid 代替 number 型的自增主键,可以避免 id 被攻击者猜到,从而进行批量操作。
- token 也是利用不可预测性,攻击者无法构造 token 也就无法进行攻击。
有了这些安全原则,我们就可以开干了,接下来介绍几个常见的攻防案例。
# 安全攻防案例
安全攻防的案例非常多,这里主要介绍几个出镜率比较高的安全问题。
# 客户端攻击
- XSS 攻击
- CSRF 攻击
- 点击劫持
# XSS 攻击
XSS 攻击的本质是将用户数据当成了 HTML 代码一部分来执行,从而混淆原本的语义,产生新的语义。
如图所示,我们注册了一个 <script>alert(document.cookie)</script>
的用户名,所有能看到此用户名字的页面,都会弹出当前浏览器的 Cookie,如果代码的逻辑是将 Cookie 发送到攻击者的网站,攻击者就能冒充当前用户进行登录了。
XSS 攻击方式有很多,所有和用户交互的地方,都有可能存在 XSS 攻击。
例如:
- 所有 input 框。
- window.location。
- window.name。
- document.referrer。
- document.cookie。
- localstorage。
- ...
由于页面中与用户交互的地方非常多,肯定还有一些 XSS 的攻击方式没有被发现,而一旦被黑帽子发现,就可能造成严重的影响,所以我们务必引起重视。
# XSS 攻击影响
被 XSS 攻击成功后,攻击者就可以获取大量的用户信息,例如:
- 识别用户 UA。
- 识别用户浏览器扩展。
- 识别用户浏览过的网站。
- 通过 CSS 的 Visited 属性。
- 获取用户真实的 IP。
- 通过 WebRTC 等。
- 盗取 Cookie
- 伪造用户登录,窃取用户资料。
- XSS 钓鱼。
- 向页面注入一个登录弹窗,让用户认为是网站内的登录弹窗(其实是钓鱼网站的),一旦用户登录,账号密码就泄露给了钓鱼网站。
# XSS 攻击防御
目前来说,XSS 已经得到了互联网行业的重视,许多开发框架都内置了安全的 HTML 渲染方法。
我们也可以自定义进行一些安全配置。
- 配置 HTTP 中的 http-only 头,让前端 JS 不能操作 Cookie。
- 输入检查,在用户提交数据时,使用 XssFilter 过滤掉不安全的数据。
- 输出检查,在页面渲染的时候,过滤掉危险的数据。
# CSRF 攻击
CSRF(Cross-site request forgery)跨站请求伪造,是一种利用用户身份,执行一些用户非本意的操作。
如图所示:
- 用户先登录了服务器 B,然后去访问服务器 C。
- 服务器 C 通过恶意脚本,冒充 A 去调用服务器 B 上的某个功能,
- 对于服务器 B 来说,还以为这是 A 发起的请求,就当作正常请求处理了。
试想一下,如果 C 冒充 A 进行了一次转账,必定会造成大量的经济损失。
# CSRF 防御方式
防御 CSRF 主要有以下几种方式:
- 验证码
- 每一次请求都要求用户验证,以确保请求真实可靠。
- 即:利用恶意脚本不能识别复杂的验证码的特点,保证每次请求都是合法的。
- Referer 检查
- 检查发起请求的服务器,是否为目标服务器。
- 即:HTTP 请求中的 Referer 头传递了当前请求的域名,如果此域名是非法服务器的域名,则需要禁止访问。
- Token
- 利用不可预测性原则,每一请求必须带上一段随机码,这段随机码由正常用户保存,黑帽子不知道随机码,也就无法冒充用户进行请求了。
# 点击劫持
点击劫持是一种视觉欺骗的攻击手段。攻击者将需要攻击的网站通过 iframe 嵌套的方式嵌入自己的网页中,并将 iframe 设置为透明,在页面中透出一个按钮诱导用户点击。
就像一张图片上面铺了一层透明的纸一样,你看到的是攻击者的页面,但是其实这个页面只是在底部,而你真正点击的是被攻击者透明化的另一个网页。
如果所示,当你点击了页面上的按钮之后,本以为会。。。而真正执行的操作是关注了某人的博客。
# 点击劫持防御
由于点击劫持主要通过 iframe,所以在防御时,主要基于 iframe 去做。
方案一:frame busting
- 正常网站使用 JS 脚本判断是否被恶意网站嵌入,如:博客网站监测到被一个 iframe 打开,自动跳转到正常的页面即可。
if (self !== top) { // 跳回原页面 top.location = self.location; }
1
2
3
4方案二:使用 HTTP 中的 x-frame-options 头,控制 iframe 的加载,它有 3 个值可选:
- DENY,表示页面不允许通过 iframe 的方式展示。
- SAMEORIGIN,表示页面可以在相同域名下通过 iframe 的方式展示。
- ALLOW-FROM,表示页面可以在指定来源的 iframe 中展示。
配置 iframe 的 sandbox (opens new window) 属性
- sandbox = "allow-same-origin" 则只能加载与主站同域的资源。
# 服务器端攻击
服务器端的攻击的方式也非常多,这里列举几个常见的。
- SQL 注入攻击
- 文件上传漏洞
- 登录认证攻击
- 应用层拒绝服务攻击
- webServer 配置安全
# SQL 注入攻击
SQL 注入和 XSS 一样,都是违背了数据和代码分离原则导致的攻击方式。
如图所示,我们利用 SQL 注入,就能在不需要密码的情况下,直接登录管理员的账号。
攻击的前提是:后端只用了简单的拼接 SQL 的方式去查询数据。
# 拼接出来的 sql 如下:
select * from user where username = 'admin' or 1=1 and password = 'xxx'
# 无论密码输入什么,这条 sql 语句都能查询到管理员的信息
2
3
除此之外,SQL 注入还有以下几种方式:
- 使用 SQL 探测,猜数据库表名,列名。
- 通过 MySQL 内置的 benchmark 探测数据库字段。
- 如:一段伪代码
select database as current if current[0]==='a',benchmark(10000,'猜对了')
如果表明猜对了,就延迟 10 s 并返回成功。
- 使用存储过程执行系统命令
- 通过内置的方法或存储过程执行 shell 脚本。
- 如:xp_cmdshell、sys_eval、sys_exec 等。
- 字符串截断
- 如:MySQL 在处理超长的字符串时,会显示警告,但会执行成功。
- 注册一个 admin + 50 个空格的用户,会触发截断,最终新增一个 admin 用户,这样就能拥有管理员权限了。
# SQL 注入防御
防止 SQL 注入的最好的办法就是,不要手动拼接 SQL 语句。
- 最佳方案,使用预编译语句绑定变量
- 通常是指框架提供的拼接 SQL 变量的方法。
- 这样的语义不会发生改变,变量始终被当成变量。
- 严格限制数据类型,如果注入了其他类型的数据,直接报错,不允许执行。
- 使用安全的存储过程和系统函数。
# CRLF 注入
在注入攻击中,换行符注入也是非常常见的一种攻击方式。
- 如果在 HTTP 请求头中注入 2 个换行符,会导致换行符后面的所有内容都被解析成请求实体部分。
- 攻击者通常在 Set-Cookie 时,注入换行符,控制请求传递的内容。
# 文件上传漏洞
上传文件是网页开发中的一个常见功能,如果不加处理,很容易就会造成攻击。
如图所示,攻击者上传了一个木马文件,并且通过返回的 URL 进行访问,就能控制服务器。
通常我们会控制上传文件的后缀名,但也不能完全解决问题,攻击者还可以通过以下方式进行攻击:
- 伪造正常文件
- 将木马文件伪装成正常的后缀名进行上传。
- 如果要避免这个问题,我们可以继续判断上传文件的文件头前 10 个字节。
- Apache 解析方式是从后往前解析,直到找到一个认识的后缀名为止
- 如:上传一个
abc.php.rar.rar.rar
能绕过后缀名检查,但在执行时,被当成一个 php 文件进行执行。
- 如:上传一个
- IIS 会截断分号进行解析
- 如:
abc.asp;xx.png
能绕过后缀名检查,但在执行时,被当成一个 asp 文件进行执行。
- 如:
- HTTP PUT 方法允许将文件上传到指定位置
- 通过 HTTP MOVE 方法,还能修改上传的文件名。
- 通过二者配合,就能先上传一个正常的后缀名,然后改为一个恶意的后缀名。
- PHP CGI 路径问题
- 执行
http://abc.com/test.png/xxx.php
时,会把 test.png 当做 php 文件去解析。 - 如果用户正好是把一段恶意的 php 脚本当做一张图片进行上传,就会触发这个攻击。
- 执行
# 文件上传漏洞防御
防御文件上传漏洞,可以从以下几点考虑:
- 将文件上传的目录设置为不可执行。
- 判断文件类型
- 检查 MIME Type,配置白名单。
- 检查后缀名,配置白名单。
- 使用随机数改写文件名和文件路径
- 上传文件后,随机修改文件名,让攻击者无法执行攻击。
- 单独设置文件服务器的域名
- 单独做一个文件服务器,并使用单独的域名,利用同源策略,规避客户端攻击。
- 通常做法是将静态资源存放在 CDN 上。
# 登录认证攻击
登录认证攻击可以理解为一种破解登录的方法。攻击者通常采用以下几种方式进行破解:
- 彩虹表
- 攻击者通过搜集大量明文和 MD5 的对应关系,用于破解 MD5 密文找出原文。
- 对于彩虹表中的 MD5 密码,我们可以加盐,进行二次加密,避免被破解。
- Session Fixation 攻击
- 利用应用系统在服务器的 SessionID 固定不变机制,借助他人用相同的 SessionID 获取认证和授权。
- 攻击者登录失败后,后端返回了 SessionID,攻击者将 SessionID 交给正常用户去登录,登录成功后,攻击者就能使用这个 SessionID 冒充正常用户登录了。
- 如果浏览器每一次登录都刷新 SessionID 可以避免这个问题。
- Session 保持攻击
- 有些时候,后端出于用户体验考虑,只要这个用户还活着,就不会让这个用户的 Session 失效。
- 攻击者可以通过不停发起请求,可以让这个 Session 一直活下去。
# 登录认证防御方式
- 多因素认证
- 密码作为第一道防御,但在密码验证成功后,我们还可以继续验证:动态口令,数字证书,短信验证码等,以保证用户安全。
- 由于短信和网页完全是 2 套独立的系统,攻击者很难获取到短信验证码,也就无法进行攻击。
除此之外,前端登录认证还有多种方式,如果你对此感兴趣,可以参考我之前写的《前端登录,这一篇就够了》。
# 应用层拒绝服务攻击
应用层拒绝服务攻击,又叫 DDOS 攻击,它指的是利用大量的请求造成资源过载,导致服务器不可用。
通常有以下几种 DDOS 攻击方式:
- SYN Flood 洪水攻击
- 利用 HTTP 3 次握手机制,消耗服务器连接资源。
- 如:攻击者发起大量的 HTTP 请求,但并不完成 3 次握手,而是只握手 2 次,这时服务器端会继续等待直至超时。这时的服务器会一直忙于处理大量的垃圾请求,而无暇顾及正常请求。
- Slowloris 攻击
- 以非常低的速度发送 HTTP 请求头,消耗服务器连接资源。
- 如:攻击者发送大量 HTTP 请求,但每个请求头都发的很慢,每隔 10s 发送一个字符,服务器为了等待数据,不得始终保持连接,这样一来,服务器连接数很快就被占光了。
- HTTP POST DOS
- 发送 HTTP 时,指定一个非常大的 Content-Length 然后以很长的间隔发送,消耗服务器连接资源。
- CC 攻击
- 针对一些非常消耗资源的页面,不断发起请求。
- 如:页面中的某些页面,需要后端做大量的运算,或者需要做非常耗时的数据库查询。在大量的请求下,服务器的 CPU、内存等资源可能就被占光了。
- Server Limit DOS
- 通过 XSS 注入一段超长的 Cookie,导致超出 Web 服务器所能承受的 Request Header 长度,服务器端就会拒绝此服务。
- ReDOS
- 针对一些缺陷的正则表达式,发起大量请求,耗光系统资源。
# 应用层拒绝服务攻击防御
对于应用层拒绝服务攻击,目前也没有特别完美的解决方案,不过我们还是可以进行一些优化。
- 应用代码做好性能优化
- 合理使用 Redis、Memcache 等缓存方案,减少 CPU 资源使用率。
- 网络架构上做好优化
- 后端搭建负载均衡。
- 静态资源使用 CDN 进行管理。
- 限制请求频率
- 服务器计算所有 IP 地址的请求频率,筛选出异常的 IP 进行禁用。
- 可以使用 LRU 算法,缓存前 1000 条请求的 IP,如果有 IP 请求频率过高,就进行禁用。
其实,处理 DDOS 核心思路就是禁用不可信任的用户,确保资源都是被正常的用户所使用。
# WebServer 配置安全
我们在部署 web 应用的时候,经常会用到 Nginx、Apache、IIS、Tomcat、Jboss 等 Web 服务器,这些服务器本身也存在一些安全隐患,如果配置不当,很容易收到攻击。
在配置 Web 服务器时,可以参考以下几点:
- 以用户权限运行 Web 服务器
- 遵守最小权限原则,以最小权限身份运行 Web 服务器,限制被入侵后的权限。
- 删除可视化后台
- 运行 Tomcat、Jboss 等 Web 服务器时,默认会开启一个可视化的运营后台,运行在 8080 端口,并且第一次访问是没有认证的。
- 攻击者可以利用可视化后台,远程加载一段 war 包或者上传木马文件,进行控制。
- 及时更新版本
- 主流的 Web 服务器,每隔一段时间就会修复一些漏洞,所以记得及时更新版本。
# 总结与思考
本文介绍了 Web 安全的基本概念,以及大量的攻防技巧,其实这只是 Web 安全中的冰山一角,如果你对此感兴趣,不妨在安全领域继续深耕学习,一定能看到更广阔一片天。
对于一个开发者来说,我们应该在写代码时就将安全考虑其中,形成自己的一套安全开发体系,做到心中有安全,时时考虑安全,就能无形之中化解不法分子的攻击。
最后,如果你对此有任何想法,欢迎留言评论!
← TCP 协议总结 前端登录,这一篇就够了 →