当前位置: 首页 > news >正文

免费制作网站app校园网上零售网站建设方案

免费制作网站app,校园网上零售网站建设方案,seoul是啥意思,做网站找哪家公司比较好什么是 Google Protocol Buffer#xff1f; 假如您在网上搜索#xff0c;应该会得到类似这样的文字介绍#xff1a;Google Protocol Buffer( 简称 Protobuf) 是 Google 公司内部的混合语言数据标准#xff0c;目前已经正在使用的有超过 48,162 种报文格式定义和超过 12,18…什么是 Google Protocol Buffer 假如您在网上搜索应该会得到类似这样的文字介绍Google Protocol Buffer( 简称 Protobuf) 是 Google 公司内部的混合语言数据标准目前已经正在使用的有超过 48,162 种报文格式定义和超过 12,183 个 .proto 文件。他们用于 RPC 系统和持续数据存储系统。Protocol Buffers 是一种轻便高效的结构化数据存储格式可以用于结构化数据串行化或者说序列化。它很适合做数据存储或 RPC 数据交换格式。可用于通讯协议、数据存储等领域的语言无关、平台无关、可扩展的序列化结构数据格式。目前提供了 C、Java、Python 三种语言的 API。 或许您和我一样在第一次看完这些介绍后还是不明白 Protobuf 究竟是什么那么我想一个简单的例子应该比较有助于理解它。 一个简单的例子 安装 Google Protocol Buffer 在网站 http://code.google.com/p/protobuf/downloads/list上可以下载 Protobuf 的源代码。然后解压编译安装便可以使用它了。 安装步骤如下所示 1 2 3 4 5 6 tar -xzf protobuf-2.1.0.tar.gz cd protobuf-2.1.0 ./configure --prefix$INSTALL_DIR make make check make install 关于简单例子的描述 我打算使用 Protobuf 和 C 开发一个十分简单的例子程序。 该程序由两部分组成。第一部分被称为 Writer第二部分叫做 Reader。 Writer 负责将一些结构化的数据写入一个磁盘文件Reader 则负责从该磁盘文件中读取结构化数据并打印到屏幕上。 准备用于演示的结构化数据是 HelloWorld它包含两个基本数据 ID为一个整数类型的数据Str这是一个字符串 书写 .proto 文件 首先我们需要编写一个 proto 文件定义我们程序中需要处理的结构化数据在 protobuf 的术语中结构化数据被称为 Message。proto 文件非常类似 java 或者 C 语言的数据定义。代码清单 1 显示了例子应用中的 proto 文件内容。 清单 1. proto 文件 1 2 3 4 5 6 7 package lm; message helloworld {    required int32     id 1;  // ID    required string    str 2;  // str    optional int32     opt 3;  //optional field } 一个比较好的习惯是认真对待 proto 文件的文件名。比如将命名规则定于如下 1 packageName.MessageName.proto 在上例中package 名字叫做 lm定义了一个消息 helloworld该消息有三个成员类型为 int32 的 id另一个为类型为 string 的成员 str。opt 是一个可选的成员即消息中可以不包含该成员。 编译 .proto 文件 写好 proto 文件之后就可以用 Protobuf 编译器将该文件编译成目标语言了。本例中我们将使用 C。 假设您的 proto 文件存放在 $SRC_DIR 下面您也想把生成的文件放在同一个目录下则可以使用如下命令 1 protoc -I$SRC_DIR --cpp_out$DST_DIR $SRC_DIR/addressbook.proto 命令将生成两个文件 lm.helloworld.pb.h 定义了 C 类的头文件 lm.helloworld.pb.cc C 类的实现文件 在生成的头文件中定义了一个 C 类 helloworld后面的 Writer 和 Reader 将使用这个类来对消息进行操作。诸如对消息的成员进行赋值将消息序列化等等都有相应的方法。 编写 writer 和 Reader 如前所述Writer 将把一个结构化数据写入磁盘以便其他人来读取。假如我们不使用 Protobuf其实也有许多的选择。一个可能的方法是将数据转换为字符串然后将字符串写入磁盘。转换为字符串的方法可以使用 sprintf()这非常简单。数字 123 可以变成字符串”123”。 这样做似乎没有什么不妥但是仔细考虑一下就会发现这样的做法对写 Reader 的那个人的要求比较高Reader 的作者必须了 Writer 的细节。比如”123”可以是单个数字 123但也可以是三个数字 1,2 和 3等等。这么说来我们还必须让 Writer 定义一种分隔符一样的字符以便 Reader 可以正确读取。但分隔符也许还会引起其他的什么问题。最后我们发现一个简单的 Helloworld 也需要写许多处理消息格式的代码。 如果使用 Protobuf那么这些细节就可以不需要应用程序来考虑了。 使用 ProtobufWriter 的工作很简单需要处理的结构化数据由 .proto 文件描述经过上一节中的编译过程后该数据化结构对应了一个 C 的类并定义在 lm.helloworld.pb.h 中。对于本例类名为 lm::helloworld。 Writer 需要 include 该头文件然后便可以使用这个类了。 现在在 Writer 代码中将要存入磁盘的结构化数据由一个 lm::helloworld 类的对象表示它提供了一系列的 get/set 函数用来修改和读取结构化数据中的数据成员或者叫 field。 当我们需要将该结构化数据保存到磁盘上时类 lm::helloworld 已经提供相应的方法来把一个复杂的数据变成一个字节序列我们可以将这个字节序列写入磁盘。 对于想要读取这个数据的程序来说也只需要使用类 lm::helloworld 的相应反序列化方法来将这个字节序列重新转换会结构化数据。这同我们开始时那个“123”的想法类似不过 Protobuf 想的远远比我们那个粗糙的字符串转换要全面因此我们不如放心将这类事情交给 Protobuf 吧。 程序清单 2 演示了 Writer 的主要代码您一定会觉得很简单吧 清单 2. Writer 的主要代码 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 #include lm.helloworld.pb.h …    int main(void)  {       lm::helloworld msg1;   msg1.set_id(101);   msg1.set_str(“hello”);         // Write the new address book back to disk.   fstream output(./log, ios::out | ios::trunc | ios::binary);             if (!msg1.SerializeToOstream(output)) {       cerr Failed to write msg. endl;       return -1;   }           return 0;  } Msg1 是一个 helloworld 类的对象set_id() 用来设置 id 的值。SerializeToOstream 将对象序列化后写入一个 fstream 流。 代码清单 3 列出了 reader 的主要代码。 清单 3. Reader 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 #include lm.helloworld.pb.h …  void ListMsg(const lm::helloworld msg) {   cout msg.id() endl;   cout msg.str() endl;  }     int main(int argc, char* argv[]) {     lm::helloworld msg1;      {     fstream input(./log, ios::in | ios::binary);     if (!msg1.ParseFromIstream(input)) {       cerr Failed to parse address book. endl;       return -1;     }   }      ListMsg(msg1);   …  } 同样Reader 声明类 helloworld 的对象 msg1然后利用 ParseFromIstream 从一个 fstream 流中读取信息并反序列化。此后ListMsg 中采用 get 方法读取消息的内部信息并进行打印输出操作。 运行结果 运行 Writer 和 Reader 的结果如下 1 2 3 4 writer reader 101 Hello Reader 读取文件 log 中的序列化信息并打印到屏幕上。本文中所有的例子代码都可以在附件中下载。您可以亲身体验一下。 这个例子本身并无意义但只要您稍加修改就可以将它变成更加有用的程序。比如将磁盘替换为网络 socket那么就可以实现基于网络的数据交换任务。而存储和交换正是 Protobuf 最有效的应用领域。 和其他类似技术的比较 看完这个简单的例子之后希望您已经能理解 Protobuf 能做什么了那么您可能会说世上还有很多其他的类似技术啊比如 XMLJSONThrift 等等。和他们相比Protobuf 有什么不同呢 简单说来 Protobuf 的主要优点就是简单快。 这有测试为证项目 thrift-protobuf-compare 比较了这些类似的技术图 1 显示了该项目的一项测试结果Total Time. 图 1. 性能测试结果 Total Time 指一个对象操作的整个时间包括创建对象将对象序列化为内存中的字节序列然后再反序列化的整个过程。从测试结果可以看到 Protobuf 的成绩很好感兴趣的读者可以自行到网站 http://code.google.com/p/thrift-protobuf-compare/wiki/Benchmarking上了解更详细的测试结果。 Protobuf 的优点 Protobuf 有如 XML不过它更小、更快、也更简单。你可以定义自己的数据结构然后使用代码生成器生成的代码来读写这个数据结构。你甚至可以在无需重新部署程序的情况下更新数据结构。只需使用 Protobuf 对数据结构进行一次描述即可利用各种不同语言或从各种不同数据流中对你的结构化数据轻松读写。 它有一个非常棒的特性即“向后”兼容性好人们不必破坏已部署的、依靠“老”数据格式的程序就可以对数据结构进行升级。这样您的程序就可以不必担心因为消息结构的改变而造成的大规模的代码重构或者迁移的问题。因为添加新的消息中的 field 并不会引起已经发布的程序的任何改变。 Protobuf 语义更清晰无需类似 XML 解析器的东西因为 Protobuf 编译器会将 .proto 文件编译生成对应的数据访问类以对 Protobuf 数据进行序列化、反序列化操作。 使用 Protobuf 无需学习复杂的文档对象模型Protobuf 的编程模式比较友好简单易学同时它拥有良好的文档和示例对于喜欢简单事物的人们而言Protobuf 比其他的技术更加有吸引力。 Protobuf 的不足 Protbuf 与 XML 相比也有不足之处。它功能简单无法用来表示复杂的概念。 XML 已经成为多种行业标准的编写工具Protobuf 只是 Google 公司内部使用的工具在通用性上还差很多。 由于文本并不适合用来描述数据结构所以 Protobuf 也不适合用来对基于文本的标记文档如 HTML建模。另外由于 XML 具有某种程度上的自解释性它可以被人直接读取编辑在这一点上 Protobuf 不行它以二进制的方式存储除非你有 .proto 定义否则你没法直接读出 Protobuf 的任何内容【 2 】。 高级应用话题 更复杂的 Message 到这里为止我们只给出了一个简单的没有任何用处的例子。在实际应用中人们往往需要定义更加复杂的 Message。我们用“复杂”这个词不仅仅是指从个数上说有更多的 fields 或者更多类型的 fields而是指更加复杂的数据结构 嵌套 Message 嵌套是一个神奇的概念一旦拥有嵌套能力消息的表达能力就会非常强大。 代码清单 4 给出一个嵌套 Message 的例子。 清单 4. 嵌套 Message 的例子 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 message Person {  required string name 1;  required int32 id 2;        // Unique ID number for this person.  optional string email 3;    enum PhoneType {    MOBILE 0;    HOME 1;    WORK 2;  }    message PhoneNumber {    required string number 1;    optional PhoneType type 2 [default HOME];  }  repeated PhoneNumber phone 4; } 在 Message Person 中定义了嵌套消息 PhoneNumber并用来定义 Person 消息中的 phone 域。这使得人们可以定义更加复杂的数据结构。 4.1.2 Import Message 在一个 .proto 文件中还可以用 Import 关键字引入在其他 .proto 文件中定义的消息这可以称做 Import Message或者 Dependency Message。 比如下例 清单 5. 代码 1 2 3 4 5 6 import common.header;   message youMsg{  required common.info_header header 1;  required string youPrivateData 2; } 其中 ,common.info_header定义在common.header包内。 Import Message 的用处主要在于提供了方便的代码管理机制类似 C 语言中的头文件。您可以将一些公用的 Message 定义在一个 package 中然后在别的 .proto 文件中引入该 package进而使用其中的消息定义。 Google Protocol Buffer 可以很好地支持嵌套 Message 和引入 Message从而让定义复杂的数据结构的工作变得非常轻松愉快。 动态编译 一般情况下使用 Protobuf 的人们都会先写好 .proto 文件再用 Protobuf 编译器生成目标语言所需要的源代码文件。将这些生成的代码和应用程序一起编译。 可是在某且情况下人们无法预先知道 .proto 文件他们需要动态处理一些未知的 .proto 文件。比如一个通用的消息转发中间件它不可能预知需要处理怎样的消息。这需要动态编译 .proto 文件并使用其中的 Message。 Protobuf 提供了 google::protobuf::compiler 包来完成动态编译的功能。主要的类叫做 importer定义在 importer.h 中。使用 Importer 非常简单下图展示了与 Import 和其它几个重要的类的关系。 图 2. Importer 类 Import 类对象中包含三个主要的对象分别为处理错误的 MultiFileErrorCollector 类定义 .proto 文件源目录的 SourceTree 类。 下面还是通过实例说明这些类的关系和使用吧。 对于给定的 proto 文件比如 lm.helloworld.proto在程序中动态编译它只需要很少的一些代码。如代码清单 6 所示。 清单 6. 代码 1 2 3 4 5 6 7 google::protobuf::compiler::MultiFileErrorCollector errorCollector google::protobuf::compiler::DiskSourceTree sourceTree;   google::protobuf::compiler::Importer importer(sourceTree, errorCollector); sourceTree.MapPath(, protosrc);   importer.import(“lm.helloworld.proto”); 首先构造一个 importer 对象。构造函数需要两个入口参数一个是 source Tree 对象该对象指定了存放 .proto 文件的源目录。第二个参数是一个 error collector 对象该对象有一个 AddError 方法用来处理解析 .proto 文件时遇到的语法错误。 之后需要动态编译一个 .proto 文件时只需调用 importer 对象的 import 方法。非常简单。 那么我们如何使用动态编译后的 Message 呢我们需要首先了解几个其他的类 Package google::protobuf::compiler 中提供了以下几个类用来表示一个 .proto 文件中定义的 message以及 Message 中的 field如图所示。 图 3. 各个 Compiler 类之间的关系 类 FileDescriptor 表示一个编译后的 .proto 文件类 Descriptor 对应该文件中的一个 Message类 FieldDescriptor 描述一个 Message 中的一个具体 Field。 比如编译完 lm.helloworld.proto 之后可以通过如下代码得到 lm.helloworld.id 的定义 清单 7. 得到 lm.helloworld.id 的定义的代码 1 2 3 4 const protobuf::Descriptor *desc    importer_.pool()-FindMessageTypeByName(“lm.helloworld”); const protobuf::FieldDescriptor* field    desc-pool()-FindFileByName (“id”); 通过 DescriptorFieldDescriptor 的各种方法和属性应用程序可以获得各种关于 Message 定义的信息。比如通过 field-name() 得到 field 的名字。这样您就可以使用一个动态定义的消息了。 编写新的 proto 编译器 随 Google Protocol Buffer 源代码一起发布的编译器 protoc 支持 3 种编程语言Cjava 和 Python。但使用 Google Protocol Buffer 的 Compiler 包您可以开发出支持其他语言的新的编译器。 类 CommandLineInterface 封装了 protoc 编译器的前端包括命令行参数的解析proto 文件的编译等功能。您所需要做的是实现类 CodeGenerator 的派生类实现诸如代码生成等后端工作 程序的大体框架如图所示 图 4. XML 编译器框图 在 main() 函数内生成 CommandLineInterface 的对象 cli调用其 RegisterGenerator() 方法将新语言的后端代码生成器 yourG 对象注册给 cli 对象。然后调用 cli 的 Run() 方法即可。 这样生成的编译器和 protoc 的使用方法相同接受同样的命令行参数cli 将对用户输入的 .proto 进行词法语法等分析工作最终生成一个语法树。该树的结构如图所示。 图 5. 语法树 其根节点为一个 FileDescriptor 对象请参考“动态编译”一节并作为输入参数被传入 yourG 的 Generator() 方法。在这个方法内您可以遍历语法树然后生成对应的您所需要的代码。简单说来要想实现一个新的 compiler您只需要写一个 main 函数和一个实现了方法 Generator() 的派生类即可。 在本文的下载附件中有一个参考例子将 .proto 文件编译生成 XML 的 compiler可以作为参考。 Protobuf 的更多细节 人们一直在强调同 XML 相比 Protobuf 的主要优点在于性能高。它以高效的二进制方式存储比 XML 小 3 到 10 倍快 20 到 100 倍。 对于这些 “小 3 到 10 倍”,“快 20 到 100 倍”的说法严肃的程序员需要一个解释。因此在本文的最后让我们稍微深入 Protobuf 的内部实现吧。 有两项技术保证了采用 Protobuf 的程序能获得相对于 XML 极大的性能提高。 第一点我们可以考察 Protobuf 序列化后的信息内容。您可以看到 Protocol Buffer 信息的表示非常紧凑这意味着消息的体积减少自然需要更少的资源。比如网络上传输的字节数更少需要的 IO 更少等从而提高性能。 第二点我们需要理解 Protobuf 封解包的大致过程从而理解为什么会比 XML 快很多。 Google Protocol Buffer 的 Encoding Protobuf 序列化后所生成的二进制消息非常紧凑这得益于 Protobuf 采用的非常巧妙的 Encoding 方法。 考察消息结构之前让我首先要介绍一个叫做 Varint 的术语。 Varint 是一种紧凑的表示数字的方法。它用一个或多个字节来表示一个数字值越小的数字使用越少的字节数。这能减少用来表示数字的字节数。 比如对于 int32 类型的数字一般需要 4 个 byte 来表示。但是采用 Varint对于很小的 int32 类型的数字则可以用 1 个 byte 来表示。当然凡事都有好的也有不好的一面采用 Varint 表示法大的数字则需要 5 个 byte 来表示。从统计的角度来说一般不会所有的消息中的数字都是大数因此大多数情况下采用 Varint 后可以用更少的字节数来表示数字信息。下面就详细介绍一下 Varint。 Varint 中的每个 byte 的最高位 bit 有特殊的含义如果该位为 1表示后续的 byte 也是该数字的一部分如果该位为 0则结束。其他的 7 个 bit 都用来表示数字。因此小于 128 的数字都可以用一个 byte 表示。大于 128 的数字比如 300会用两个字节来表示1010 1100 0000 0010 下图演示了 Google Protocol Buffer 如何解析两个 bytes。注意到最终计算前将两个 byte 的位置相互交换过一次这是因为 Google Protocol Buffer 字节序采用 little-endian 的方式。 图 6. Varint 编码 消息经过序列化后会成为一个二进制数据流该流中的数据为一系列的 Key-Value 对。如下图所示 图 7. Message Buffer 采用这种 Key-Pair 结构无需使用分隔符来分割不同的 Field。对于可选的 Field如果消息中不存在该 field那么在最终的 Message Buffer 中就没有该 field这些特性都有助于节约消息本身的大小。 以代码清单 1 中的消息为例。假设我们生成如下的一个消息 Test1: 1 2 Test1.id 10; Test1.str “hello” 则最终的 Message Buffer 中有两个 Key-Value 对一个对应消息中的 id另一个对应 str。 Key 用来标识具体的 field在解包的时候Protocol Buffer 根据 Key 就可以知道相应的 Value 应该对应于消息中的哪一个 field。 Key 的定义如下 1 (field_number 3) | wire_type 可以看到 Key 由两部分组成。第一部分是 field_number比如消息 lm.helloworld 中 field id 的 field_number 为 1。第二部分为 wire_type。表示 Value 的传输类型。 Wire Type 可能的类型如下表所示 表 1. Wire Type TypeMeaningUsed For0Varintint32, int64, uint32, uint64, sint32, sint64, bool, enum164-bitfixed64, sfixed64, double2Length-delimistring, bytes, embedded messages, packed repeated fields3Start groupGroups (deprecated)4End groupGroups (deprecated)532-bitfixed32, sfixed32, float 在我们的例子当中field id 所采用的数据类型为 int32因此对应的 wire type 为 0。细心的读者或许会看到在 Type 0 所能表示的数据类型中有 int32 和 sint32 这两个非常类似的数据类型。Google Protocol Buffer 区别它们的主要意图也是为了减少 encoding 后的字节数。 在计算机内一个负数一般会被表示为一个很大的整数因为计算机定义负数的符号位为数字的最高位。如果采用 Varint 表示一个负数那么一定需要 5 个 byte。为此 Google Protocol Buffer 定义了 sint32 这种类型采用 zigzag 编码。 Zigzag 编码用无符号数来表示有符号数字正数和负数交错这就是 zigzag 这个词的含义了。 如图所示 图 8. ZigZag 编码 使用 zigzag 编码绝对值小的数字无论正负都可以采用较少的 byte 来表示充分利用了 Varint 这种技术。 其他的数据类型比如字符串等则采用类似数据库中的 varchar 的表示方法即用一个 varint 表示长度然后将其余部分紧跟在这个长度部分之后即可。 通过以上对 protobuf Encoding 方法的介绍想必您也已经发现 protobuf 消息的内容小适于网络传输。假如您对那些有关技术细节的描述缺乏耐心和兴趣那么下面这个简单而直观的比较应该能给您更加深刻的印象。 对于代码清单 1 中的消息用 Protobuf 序列化后的字节序列为 1 08 65 12 06 48 65 6C 6C 6F 77 而如果用 XML则类似这样 1 2 3 4 5 6 7 8 9 31 30 31 3C 2F 69 64 3E 3C 6E 61 6D 65 3E 68 65  6C 6C 6F 3C 2F 6E 61 6D 65 3E 3C 2F 68 65 6C 6C  6F 77 6F 72 6C 64 3E   一共 55 个字节这些奇怪的数字需要稍微解释一下其含义用 ASCII 表示如下  helloworld     id101/id     namehello/name  /helloworld 封解包的速度 首先我们来了解一下 XML 的封解包过程。XML 需要从文件中读取出字符串再转换为 XML 文档对象结构模型。之后再从 XML 文档对象结构模型中读取指定节点的字符串最后再将这个字符串转换成指定类型的变量。这个过程非常复杂其中将 XML 文件转换为文档对象结构模型的过程通常需要完成词法文法分析等大量消耗 CPU 的复杂计算。 反观 Protobuf它只需要简单地将一个二进制序列按照指定的格式读取到 C 对应的结构类型中就可以了。从上一节的描述可以看到消息的 decoding 过程也可以通过几个位移操作组成的表达式计算即可完成。速度非常快。 为了说明这并不是我拍脑袋随意想出来的说法下面让我们简单分析一下 Protobuf 解包的代码流程吧。 以代码清单 3 中的 Reader 为例该程序首先调用 msg1 的 ParseFromIstream 方法这个方法解析从文件读入的二进制数据流并将解析出来的数据赋予 helloworld 类的相应数据成员。 该过程可以用下图表示 图 9. 解包流程图 整个解析过程需要 Protobuf 本身的框架代码和由 Protobuf 编译器生成的代码共同完成。Protobuf 提供了基类 Message 以及 Message_lite 作为通用的 FrameworkCodedInputStream 类WireFormatLite 类等提供了对二进制数据的 decode 功能从 5.1 节的分析来看Protobuf 的解码可以通过几个简单的数学运算完成无需复杂的词法语法分析因此 ReadTag() 等方法都非常快。 在这个调用路径上的其他类和方法都非常简单感兴趣的读者可以自行阅读。 相对于 XML 的解析过程以上的流程图实在是非常简单吧这也就是 Protobuf 效率高的第二个原因了。 移动应用客户端与服务器之间的通信协议目前比较主流的有Facebook的Thrift腾讯的JCE以及Google的Protocol Buffer以下简称protobuf本文主要介绍protobuf基本概念协议解析以及在Android中的应用实践。 一、Protocol Buffer 基本概念 Protobuf是一种灵活高效的用于序列化结构化数据的机制类似于XML但比XML更小更快更简单。Protobuf序列化为二进制数据不依赖于平台和语言同时具备很好的兼容性。Protobuf基本使用方式如下 1 . 编写proto文件applog.proto定义数据结构 syntax proto3;package com.sohu.proto.rawlog; option java_multiple_files true;message LogTime{optional int32 submit 1; optional int32 create 2; optional int32 test 16; }其中optional代表该字段是否为可选的int32代表数据类型不同的类型对应不同的编码方式wire_typesubmit为字段名1表示field_number。 2 . 使用代码生成工具protoc生成指定语言代码 --cpp_outOUT_DIR Generate C header and source.--csharp_outOUT_DIR Generate C# source file.--java_outOUT_DIR Generate Java source file.--javanano_outOUT_DIR Generate Java Nano source file.--js_outOUT_DIR Generate JavaScript source.--objc_outOUT_DIR Generate Objective C header and source.--python_outOUT_DIR Generate Python source file.--ruby_outOUT_DIR Generate Ruby source file.protoc -I$SRC_DIR --java_out$DST_DIR $SRC_DIR/applog.proto3 . 调用Protobuf API序列化及反序列化 ByteArrayOutputStream byteArrayOutputStream new ByteArrayOutputStream(); log.writeDelimitedTo(byteArrayOutputStream);ByteArrayInputStream byteArrayInputStream new ByteArrayInputStream(byteArrayOutputStream.toByteArray()); Log log Log.parseDelimitedFrom(byteArrayInputStream); 二、Protocol Buffer 编码机制 1. Base 128 Varints 所谓序列化即是将结构化数据按一定的编码规范转换为指定格式的过程protobuf使用的是Base 128 Varints的编码方式。Varints是一种使用可变字节序列化整型的方法越小的整数占用越小的字节数它的基本规则如下 1 . 每个Byte的最高位(msb)是标志位如果该位为1表示该Byte后面还有其它Byte如果该位为0表示该Byte是最后一个Byte 2 . 每个Byte的低7位是用来存数值的位 3 . Varints方法用Litte-Endian(小端字节序 比如300使用Varints序列化后的结果为1010 1100 0000 0010其运算过程如下 300转化为二进制 1 0010 1100Byte低7位存储数值 000 0010 010 1100Litte-Endian字节序 010 1100 000 0010添加MSB标志位 1010 1100 0000 0010 2. 消息结构 protobuf每条消息都是由一系列的key-value键值对组成的key和value分别采用不同的编码方式。 key的具体值为field_number 3) | wire_type也就是说Byte第一位作为标志位最后三位用于存储wire type编码数据类型其他位用于存储field_number值。可用的wire types如下 TypeMeaningUsed For0Varintint32, int64, uint32, uint64, sint32, sint64, bool, enum164-bitfixed64, sfixed64, double2Length-delimitedstring, bytes, embedded messages, packed repeated fields3Start groupgroups (deprecated)4End groupgroups (deprecated)532-bitfixed32, sfixed32, float 这六种wire type其中Start group 和 End group 已经弃用下面重点介绍Varint64-bitLength-delimited和32-bit。 Varint varint是可变字节编码类型例如logTime.submit 4; logTime.create 5; logTime.test 6则序列化后的数据有7个字节如下 wire_type总共只有六种类型因此用3bit足以表示在一个Byte里去掉mbs以及3bit的wire_type只剩下4bit来表示field_number因此一个Byte里field_number只能表达0-15如果超过15则需要两个或多个Byte来表示。 64-bit / 32-bit varint适用于表达较小的整数0-127因为mbs的存在每个字节实际能用于表达数据的只有7bit当数字很大的时候protobuf定义了64-bit和32-bit两种定长编码类型比如2的28次方两种方式表达如下 varint编码还有个问题在于不利于表达负数我们知道计算机中的负数是以其补码原码取反1形式存在的比如-1二进制表示为11111111 11111111 11111111 11111111如果我们采用varint表示则需要5个字节因为protbuf在编码格式上兼容int64所以实际上表示-1需要用到10个字节。 为了解决这个问题Protobuf提供了sint32和sint64两种数据类型。如果某个消息的某个字段出现负数值的可能性比较大那么应该使用sint32或sint64。这两种数据类型在编码时会先使用ZigZig编码将负数映射成正数然后再使用Varint编码。 Zigzig 算法如下 (n 1) ^ (n 31) // sint32 (n 1) ^ (n 63) // sint64Signed OriginalEncoded As00-1112-2321474836474294967294-21474836484294967295 Zigzag 编码用无符号数来表示有符号数正数和负数交错无论正负都可以采用较少的 Byte 来表示。 Length-delimited Length-delimited编码格式则会将数据的length也编码进最终数据使用Length-delimited编码格式的数据类型包括stringbytes和自定义消息。 message Test2 {required string b 2; }设置b的值为testing则编码之后为 12 07 74 65 73 74 69 6e 67repeated / packed optional类型是序列化单个字段而repeated类型是把每个字段依次进行序列化key相同value不同但如果repeated的字段较多每次都带上相同的key则会浪费空间因此protobuf提供了packed选项当repeated字段设置了packed选项则会使用Length-delimited格式来编码字段值。 三、Protocol Buffer 应用实践 protobuf主要用于客户端与服务器之间的数据传递比如日志上报长连接等在实际使用过程中主要遇到以下三个问题 1. 65535 method limit protobuf的标准实现会生成大量的方法数其依赖库以及自动生成的Java代码所包含的方法数在一万以上因此很容易导致Android客户端达到65535的方法数限制。 为了解决这个问题我们在生成java代码的时候可以选择生成protobuf 3.0 精简版Nano protoc -I$SRC_DIR --javanano_out$DST_DIR $SRC_DIR/applog.proto精简版使用常量代替枚举使用public代替private省略了get/set方法以及builder模式很大程度上减少了自动生成的Java代码的方法数。当然方法数的大头还是集中在protobuf的依赖库文件当我们生成nano版本的java代码时还需要找到其对应的库文件很遗憾的是Google官方并没有提供protobuf 3.0 nano 版本的依赖库以下是jcenter查询到的文件 protobuf-java-3.0.0-javadoc.jar protobuf-java-3.0.0-javadoc.jar.asc protobuf-java-3.0.0-sources.jar protobuf-java-3.0.0-sources.jar.asc protobuf-java-3.0.0.jar protobuf-java-3.0.0.jar.asc protobuf-java-3.0.0.pom protobuf-java-3.0.0.pom.asc为了解决依赖库的问题查看protobuf源码找到了javanano的源文件然后编译成jar包其依赖文件如下 至此解决了protobuf方法数问题使其能够很好的用于Android客户端与服务器数据交换。 2. Message Delimited protobuf转换成的二进制数据可以直接用于网络传输当传输一条消息的时候没有任何问题但当一次传输多条消息的时候该如何界定数据的边界呢 为了解决多条数据传输的问题我们在每条消息的头部加上数据长度那么在解析的时候就可以通过这个长度来解析对应的二进制数据。具体实现如下 public static final int DEFAULT_BUFFER_SIZE 4096;static int computePreferredBufferSize(int dataLength) {if (dataLength DEFAULT_BUFFER_SIZE) {return DEFAULT_BUFFER_SIZE;}return dataLength; }public static int computeUInt32SizeNoTag(final int value) {if ((value (~0 7)) 0) {return 1;}if ((value (~0 14)) 0) {return 2;}if ((value (~0 21)) 0) {return 3;}if ((value (~0 28)) 0) {return 4;}return 5; }public static byte[] writeDelimitedTo(MessageNano log) throws IOException {final int serialized log.getSerializedSize();final int bufferSize computePreferredBufferSize(computeUInt32SizeNoTag(serialized) serialized);byte[] data new byte[bufferSize];com.google.protobuf.nano.CodedOutputByteBufferNano codedOutputByteBufferNano CodedOutputByteBufferNano.newInstance(data);codedOutputByteBufferNano.writeRawVarint32(serialized);log.writeTo(codedOutputByteBufferNano);return data; }其核心思想在于通过消息内容每个字段的tagtype以及value计算出整个内容所占的字节数然后再计算出为了表示内容长度所需要用到的字节数这样就得到了整体需要的bufferSize最后在写入数据的时候先写入消息内容的长度再写入消息本身的内容。 基于此我们在每条消息的头部写入该消息长度实现了一次传输多条消息。 3. 长连接protobuf编码解码器 目前比较主流的长连接框架有Netty和mina为了解决数据传递过程中粘包和拆包的问题Netty提供了很多Encoder和Decoder其中也包括了对protobuf的支持比如一个典型的通信管道如下 ServerBootstrap b new ServerBootstrap();b.group(bossGroup, workerGroup); b.channel(NioServerSocketChannel.class);b.childHandler(new ChannelInitializerSocketChannel() {Overrideprotected void initChannel(SocketChannel ch) throws Exception {// Decoderch.pipeline().addLast(new ProtobufVarint32FrameDecoder());ch.pipeline().addLast(new ProtobufDecoder(Log.newBuilder().getDefaultInstanceForType()));// Encoderch.pipeline().addLast(new ProtobufVarint32LengthFieldPrepender());ch.pipeline().addLast(new ProtobufEncoder());// Register handlerch.pipeline().addLast(new ServerHandler());}});遗憾的是Netty只提供了标准支持对于Android客户端所使用的Nano版本并没有支持因此在客户端得自己实现一套基于Nano的编码解码器。为了解决这个问题我写了以下几个类 ProtobufNanoDecoder ProtobufNanoEncoder ProtobufNanoUtil ProtobufNanoVarint32FrameDecoder ProtobufNanoVarint32LengthFieldPrepender所幸的是深入理解了protobuf的编码机制自己写编码解码器也并不困难以ProtobufNanoVarint32LengthFieldPrepender为例 Sharable public class ProtobufNanoVarint32LengthFieldPrepender extends MessageToByteEncoderByteBuf {Overrideprotected void encode(ChannelHandlerContext ctx, ByteBuf msg, ByteBuf out) throws Exception {int bodyLen msg.readableBytes();int bufferSize ProtobufNanoUtil.computePreferredBufferSize(ProtobufNanoUtil.computeUInt32SizeNoTag(bodyLen) bodyLen);out.ensureWritable(bufferSize);byte[] data new byte[bufferSize];CodedOutputByteBufferNano codedOutputByteBufferNano CodedOutputByteBufferNano.newInstance(data);codedOutputByteBufferNano.writeRawVarint32(bodyLen);codedOutputByteBufferNano.writeRawBytes(msg.array(), 0, bodyLen);out.writeBytes(data);out.writeBytes(msg, msg.readerIndex(), bodyLen);}
http://www.dnsts.com.cn/news/120645.html

相关文章:

  • 建网站的公司叫什么太原seo排名公司
  • c2c的电子商务网站有哪些重庆綦江网站制作公司推荐
  • 江西网站做的好的企业文化建设主题网站的顺序是什么意思
  • 广东网站推广公司网站开发模块学些什么软件
  • 郑州外贸网站建设公司价格dede网站后台设置wap模板目录
  • 智慧景区网站服务建设wordpress 视频 去广告插件下载
  • Wordpress网站能做seo吗门户网站建设的作用及意义
  • 公司网站做好了还需石家庄经济
  • 房屋中介做网站的网站建设公司华网天下北京
  • 东莞网站建设总结网站建设美橙
  • 企业网站的建设内容流量网站建设教程
  • 百度怎么做开锁网站嵌入式开发培训机构排名
  • 一键做单页网站百度极速版下载
  • 汕头有建网站公司吗手机系统优化
  • 怎么创建网站免费的自己的电脑做网站服务器吗
  • 建站的费用哪家网站推广好
  • 建设多语种网站wordpress的密码忘记
  • 导航网站 cmsphp建站平台
  • 本地南京网站建设沙井网站推广
  • 做外贸网站要有域名信息大全
  • 个人可以做几个网站网站建设做的好
  • 招投标网站建设开发怎么样才算是一个网站页面
  • 下载类网站 前置备案设计师联盟网站
  • 深圳做微商网站设计微网站的价格
  • 中国建设报社网站网站建设方案书 人员安排
  • 官网建站合作模版优化关键词可以选择哪个工具
  • 手机怎么做电子书下载网站自己建网址
  • 盖县网站开发网站建设服务器篇
  • 怎么用虚拟主机做网站步骤网站怎样推广 优帮云
  • 招聘seo网站推广想自己做个网站怎么做