WebGL在次元秀的实践

发表于 5月以前  | 总阅读数:239 次

业务介绍

半次元,一个泛二次元兴趣的社区,这里聚集了COS、绘画、三坑、条漫、唱见等领域的共同爱好者。

次元秀作为一款捏脸应用。用户可以根据自己的偏好捏制喜欢的原创动漫人物,可以把自己捏制的人物保存动态表情套图、头像、角色卡。

欢迎下载半次元体验一下次元秀,效果录屏如下:

先整体看下次元秀的基本业务流程。主体部分包括创作端和消费端:

流程图.jpg

  • 创作端,面向具有绘画创作能力的用户,提供专业领域的生产工具。每个玩法,由多个有序图层的组成,每个图层可以有多个可选的素材;

image.png

  • 消费端,面向同好用户提供简易工具,满足用户基于PGC二次创作的诉求。消费者,可以通过切换素材、切换素材颜色、以及随机组合这三种行为,生产二创作品。

image.png

技术挑战

次元秀的页面数有20+,其中最核心的页面是编辑器。

消费端编辑器

编辑器主要由人物预览区域素材选择区域组成。其中人物预览区域需要实现如下功能:

  • 多张图片叠加绘制(部分图片存在透明度);
  • 支持图片的叠色。比如给头发进行染色,提升作品的个性化;
  • 支持整个预览效果的导出,作为作品封面使用;
  • 支持单张图层素材的导出,作为输入提供给智创的动态表情能力;

前端领域需要实现上述功能,只能借助Canvas。最初,基于Konva.js(一个Canvas框架,扩展了Canvas 2d上下文,提供了简易的方法用来创建几何、动画、交互等)实现了编辑器的绘制功能。核心流程如下:

  • 滤镜处理:通过CanvasRenderingContext2D.drawImage()把素材图片绘制到Canvas上,然后通过CanvasRenderingContext2D.getImageData()方法获取图片的像素数据;然后逐一对像素进行filter运算,得到新的像素数据;最后通过CanvasRenderingContext2D.putImageData()绘制到中间Canvas上。
  • 屏幕绘制:等到所有图片处理完成之后,再把中间canvas拷贝到主屏幕canvas上。
  • 图片导出:为了实现每个素材的导出功能,需要图片素材以独立的Canvas或imageData存在。

Canvas 2D绘制流程

但是,测试过程发现手机一个问题:多次随机操作,或者频繁切换玩法,画布大小会失真,甚至整个页面变成空白,必须强制杀掉App。

image.png

原因分析

凭借经验,最先想到的内存溢出导致的。然后使用Safari Performance调试工具查看了下次元秀的性能数据。发现次元秀的Javascript内存占用达到几百兆。

内存占用过大,最容易想到的原因之一是图片分辨率太高了,因此,首要的是利用中台能力对图片做缩放处理,降低分辨率,

不止步于此。进一步分析Canvas 2D绘制流程,可以发现Canvas 2D实现存在两点隐患:

  • 需要Javascript在内存中保留图片的像素数据,如果一个玩法的素材较多的话(一般在20+),会导致内存占用过多,剩余内存溢出。
  • 对像素数据进行逐一计算是在CPU中完成的。一般素材大小是750*750(支持ios retina屏图片高清显示),那么像素数约56w,也就是说一个素材的滤镜计算至少需要56万次计算。如果再考虑到素材的数目,计算量还有几十倍的增长。因此,滤镜计算对CPU的消耗是不容忽视的。

有什么方案,可以既减少内存消耗,又减少CPU消耗了?

解决方案

Canvas不仅可以提供2D上下文,还可以提供webgl上下文。听说WebGL适合高性能渲染,一起来看看实际效果。

WebGL是什么?

WebGL是一套图形API,使得前端可以高性能地渲染2D/3D图形。先简单了解WebGL应用是如何工作。可以把WebGL应用看成三个组成部分:

image.png

WebGL工作流

  • HTML Canvas:Canvas起初由Apple引入作为一种渲染2D图形的技术,后经Mozilla升级使得其支持3D图形渲染。Canvas作为浏览器端图形API的载体存在,因此,WebGL App必须包含HTML Canvas,通过HTMLCanvasElement.getContext()可以获得不同的渲染上下文。
var canvas = document.getElementById("canvas");
var ctx = canvas.getContext("2d");
  • GLSL ES:一种类C语言,专门用于编写着色器程序。最常用的着色器是顶点着色器(Vertex Shader)和片元着色器(Fragment Shader)。

    // 接受javascript传递过的顶点坐标(裁剪坐标系)
    const vertextSource = `
    attribute vec2 a_position;
    
    void main(void) {
      gl_Position = vec4(a_position, 0, 1);
    }
    `;
    // 下面代码,定义所有的片元都是红色。
    const fragmentSource = `
    precision mediump float;
    
    void main() {
      gl_FragColor = vec4(1.0, 0, 0, 1.0);
    }
    `;
  • 片元着色器:接受光栅化的片元数据,确定每个片元的像素值。

  • 顶点着色器:主要作用是做一些矩阵变换运算。接受javascript传递过来的顶点数据,转换到裁剪坐标系。然后顶点数据会用来生成几何图元,再进行光栅化后传递给片元着色器。

  • Javascript:Javascript负责向GPU渲染管线传递数据,比如着色器代码、顶点数据、纹理数据、颜色数据等。

// 向gpu传递矩形的四个顶点数据
const buffer = gl.createBuffer();
gl.bindBuffer(gl.ARRAY_BUFFER, buffer);
gl.bufferData(gl.ARRAY_BUFFER, new Float32Array([-1, 1, 1, 1, 1, -1, 1, -1, -1, 1, -1, -1]), gl.STATIC_DRAW);

const aLocation = gl.getAttribLocation(program, 'a_position');
gl.enableVertexAttribArray(aLocation);
gl.vertexAttribPointer(aLocation, 2, gl.FLOAT, false, 0, 0);

WebGL有什么优势?

可以把CPU看成一个管道,计算任务需要有序地逐一完成。如果单个任务执行时间较长,或者任务数太多,就会让CPU处理效率降低。

得益于并行计算架构, GPU 处理像素计算非常快。GPU可以看成一大堆小型CPU组成,多个小型CPU可以实现并行计算,一次性可以完成多个像素的颜色计算。

image.png

摘自The book of shader

WebGL如何落地

下面详细介绍一下WebGL在次元秀编辑器绘制中使用示例。

多张透明通道的图片叠加

人物是由多张具有透明通道的图片有序叠加合成的。

图片叠加

这里就会涉及一个问题:同一个位置会存在多个像素值,最终的颜色值应该如何计算?

WebGL默认,即将写入缓冲区的颜色(source color),会覆盖已经存在于缓冲区的颜色(destination color),这样的话,最终只会显示最后绘制的内容。

开发者可以让WebGL开启混合功能,使得即将写入缓存区的颜色和已经在缓冲区的颜色通过公式计算得到新的像素,常常用于半透明内容的叠加显示。混合公式如下:

WebGL提供了方法blendFunc(sfactor: GLenum, dfactor: GLenum)指定源色的比例因子和目标色的比例因子。

图片实现叠色效果

次元秀支持图片叠加任意颜色,进一步提升作品的多样性。

image.png

叠色操作

给图片叠色,本质上也是混色,和前文图片叠加的混合过程是一致的。公式如下:

图片叠色公式中,源色混合因子是源色的透明通道分量,目标色混合因子是 常量1与源色的透明通道分量的差值。

前文我们提到片元着色器就是用来决定像素的颜色值的,因此,我们只需要用GLSL ES语言在片元着色器中实现叠色公式即可。

void main() {
   vec4 v_texture_color = texture2D(u_texture, v_textureCoord);

   float alpha_minus = 1.0 - v_rgba.a;

   float blend_r = v_rgba.r * v_rgba.a + v_texture_color.r * alpha_minus;
   float blend_g = v_rgba.g * v_rgba.a + v_texture_color.g * alpha_minus;
   float blend_b = v_rgba.b * v_rgba.a + v_texture_color.b * alpha_minus;

   gl_FragColor = vec4(blend_r, blend_g, blend_b, v_texture_color.a);
}

同步绘制多张图片

首先,看下如何绘制多张图片。在WebGL 1.0,想要绘制多张图片,一般有两种方式:

  • 使用一个矩形,设置多个纹理单元,每个纹理单元可以代表一个纹理图片。但由于纹理单元的数目有上限,且不同机器上限值也不同。次元秀图片数较多,因此不适用次元秀。
  • 绘制多个矩形,每个矩形贴一张纹理图片。次元秀采用此方案实现多张图片的绘制。

如果每次绘制都直接作用到屏幕的话,会让用户看见人物是一张张图片的绘制出来,如下视频:

这里可以使用离屏画布(不显示到屏幕上),图片先依次绘制到离屏画布,等到所有图片绘制完成,再把离屏画布绘制到屏幕画布即可。在WebGL的世界,可以用FrameBuffer实现离屏画布。

image.png

framebuffer渲染流程

数据验证

image.png

分析数据可见,相比于canvas 2D, webgl 对CPU和内存的消耗都出现大幅度地下降。

  • 相比于Canvas版本,WebGL版本的CPU负载下降30% - 83%;
  • 相比于Canvas版本,WebGL版本的image内存消耗下降78% - 83%;
  • 相比于Canvas版本,WebGL版本的javascript内存消耗下降60% - 77%;

https://mp.weixin.qq.com/s/pfNhFV1dSuBzWLBqiTpPZg

 相关推荐

集体大降薪?有员工吐槽:再降要去公园卖鱼

6月5日,一张券商降薪截图在社交媒体疯传。截图提到,当日上午,某中字头头部券商召开大会,除了MD外全员降薪,且降薪不只是降奖金,而是直接降底薪。按照职级不同,SA1降6K,SA3降8K,VP降8K—10K。据了解,降薪大概率整体属实,但具体幅度有所差异,且不同区域、不同业务条线目前掌握的降薪情况也不尽相同。

发布于:3天以前  |  1674次阅读  |  详细内容 »

或搭载骁龙 8 Gen2,李斌透露蔚来手机新进展

今日,蔚来 CEO 李斌在 2023 高通汽车技术与合作峰会上爆料,蔚来第二代技术平台的全系车型已标配第三代骁龙座舱平台。

发布于:13天以前  |  679次阅读  |  详细内容 »

Meta AI大模型能识别4000多种语言,称错误率仅有OpenAI产品的一半

Meta公司周一(5月22日)推出了一个开源AI语言模型——大规模多语言语音(Massively Multilingual Speech, MMS)模型,可以识别和产生1000多种语言的语音——比目前可用的模型增加了10倍。研究人员表示,他们的模型可以转换1000多种语言,但能识别4000多种语言。

发布于:15天以前  |  627次阅读  |  详细内容 »

“AI孙燕姿”火遍全网!孙燕姿发文回应:人类无法超越AI,你是可定制的

歌手孙燕姿在更新动态中回应了近日引发争议的“顶流AI歌手孙燕姿”,笑称粉丝已经接受她是“冷门”歌手,而AI成为了目前的顶流。

发布于:15天以前  |  596次阅读  |  详细内容 »

荣耀回应新设公司自研芯片传言:重点在终端侧核心软件、图形算法等研发

5月31日晚,荣耀方面对澎湃新闻记者表示,上海荣耀智能科技开发有限公司是荣耀位于上海的研究所,是荣耀在中国的5个研究中心之一,重点方向在终端侧核心软件、图形算法、通信、拍照等方面研究开发工作。荣耀强调,坚持以用户为中心,开放创新,与全球合作伙伴一起为用户提供最佳产品解决方案。

发布于:9天以前  |  320次阅读  |  详细内容 »

宣称“M1芯片速度最快”,苹果被罚20万元:M1 Pro和Max更快

据北京市市场监督管理局公示信息,5月24日,苹果电子产品商贸(北京)有限公司因发布虚假广告被北京市东城区市场监督管理局处以20万元的行政处罚。

发布于:8天以前  |  235次阅读  |  详细内容 »

因PC销售不景气,联想Q1裁员约5%

据外媒5月24日消息,全球最大的个人电脑制造商联想表示,在2023年1-3月期间,该公司裁员了约5%,这是由于PC市场不景气导致的。

发布于:13天以前  |  216次阅读  |  详细内容 »

博主发布“史上最清晰”小米汽车谍照:猎跑风格,体积“特别大”

日前,有网络博主号称拍摄到了小米首款汽车MS11的高清视频。从视频中可以看出,新车依旧包裹大面积的伪装,据该博主称,他之所以确定这是小米汽车,是因为靠近观察之后,发现它的三角形大灯轮廓和其最初手绘的小米汽车假想图几乎一模一样。

发布于:8天以前  |  215次阅读  |  详细内容 »

ChatGPT 之父警告:AI 可能灭绝人类,350 名 AI 权威签署联名公开信

超过 350 名从事人工智能工作的高管、研究人员和工程师签署了这份由非盈利组织人工智能安全中心发布的公开信,认为人工智能具备可能导致人类灭绝的风险,应当将其视为与流行病和核战争同等的社会风险。

发布于:10天以前  |  207次阅读  |  详细内容 »

错失英伟达后,木头姐预测:AI的下一波机会在软件

日前,以押注“颠覆性创新”著称的ARK Invest创始人Cathie Wood在接受媒体采访时表示,软件提供商将是人工智能狂潮的下一个受益板块。英伟达每卖出1美元的硬件,软件供应商SaaS供应商就会产生8美元的收入。

发布于:8天以前  |  204次阅读  |  详细内容 »

小米投资恩井汽车科技公司

小米产投管理合伙人孙昌旭对此表示,小米产投将充分运用产业资源,与恩井科技形成高度业务协同,助力公司实现跨越式发展。

发布于:11天以前  |  192次阅读  |  详细内容 »

阿里云首席安全科学家吴翰清离职,投身AI短视频创业

据报道,阿里巴巴研究员吴翰清已于近期离职,钉钉显示其离职时间是5月19日。在阿里内部,研究员的职级为P10。据消息人士透露,吴翰清离职后,选择AI短视频赛道创业,已经close一轮融资。对于上述消息,截至发稿,阿里尚未回应。

发布于:13天以前  |  190次阅读  |  详细内容 »

阿里巴巴否认裁员传言,今年预估新招15000人

阿里巴巴集团官微宣布,2023年六大业务集团总计需新招15000人,其中校招超过3000人。同时表示,“近日,关于淘宝天猫、阿里云、菜鸟、本地生活各个业务裁员谣言传得很厉害,但谣言就是谣言。我们的招聘正在紧锣密鼓的进行。”

发布于:13天以前  |  183次阅读  |  详细内容 »

李开复:AI2.0带来的市场机遇会比移动互联网大10倍

“现今每一个存在的应用都将被AI 2.0重构,我觉得整个AI大模型带来的机遇和技术浪潮,会比过去Windows和安卓大10倍。”李开复表示。

发布于:10天以前  |  177次阅读  |  详细内容 »

一文读懂苹果WWDC大会:头显Vision Pro正式发布,售价高达2.5万元

苹果发布Vision Pro头显,正式宣布开启空间计算时代;苹果还发布新款MacBook Air,新款Mac Studio,并展示了iOS17、iPadOS 17、macOS Sonoma和watchOS10等新系统;Vision Pro头显售价3499美元,将于2024年初正式在美国市场发售;华尔街并不看好Vision Pro,苹果股价周一创历史新高后由涨转跌。

发布于:3天以前  |  169次阅读  |  详细内容 »

车圈“地震”:长城汽车实名举报比亚迪,比亚迪强势回应

5月25日,长城汽车就比亚迪秦PLUS DM-i、宋PLUS DM-i采用常压油箱,涉嫌整车蒸发污染物排放不达标的问题进行举报。

发布于:13天以前  |  159次阅读  |  详细内容 »

贾跃亭开抖音号,IP 在美国,粉丝数量53.7万,关注前妻甘薇

近日,一个名为“贾跃亭”的抖音账号悄然出现,带有“FF创始人、合伙人、首席产品及用户生态官, LeEco 乐视创始人”等标签,IP 地址显示为美国。

发布于:10天以前  |  146次阅读  |  详细内容 »

英伟达史诗级暴涨后再放大招!推出E级AI超算,黄仁勋狂捧生成式AI

5月29日消息,继上周远超预期的财报业绩预测引得股价和市值史诗级暴涨后,今日,英伟达(NVIDIA)创始人兼CEO黄仁勋穿着标志性的皮衣,意气风发地出现在台北电脑展COMPUTEX 2023上,在主题演讲期间先是现场给自家显卡带货,然后一连公布涉及加速计算和人工智能(AI)的多项进展。

发布于:10天以前  |  146次阅读  |  详细内容 »

苹果官方:618将在天猫开启全球首次直播

近日,苹果位于天猫的Apple Store官方旗舰店挂出直播预告,表示将在5月31日晚19时开启官方直播,这也是苹果官方在电商平台的全球首次直播。

发布于:10天以前  |  145次阅读  |  详细内容 »

前京东集团副总裁梅涛成立生成式 AI 公司,投身多模态领域

前京东集团副总裁、京东探索研究院副院长梅涛自今年初离职后,确认在 AI 领域创业,成立生成式 AI 公司 HiDream.ai。

发布于:8天以前  |  144次阅读  |  详细内容 »
 相关文章
 目录