标签:XA 建议 size 字段 googl 枚举 理解 project rpc
本文是对官方文档的翻译,大部分内容都是引用其他一些作者的优质翻译使文章内容更加通俗易懂(自己是直译,读起来有点绕口难理解,本人英文水平有限),参考的文章链接在文章末尾
这篇指南描述如何使用protocol buffer语言来组织你的protocol buffer数据,包括.proto文件的语法规则以及如何通过.proto文件来生成数据访问类代码。
syntax = "proto3";
message SearchRequest {
string query = 1;
int32 page_number = 2;
int32 result_per_page = 3;
}
在上面的例子中,该消息定义了三个字段,两个int32类型和一个string类型的字段
消息中的每一个字段都有一个独一无二的数值类型的编号。1到15使用一个字节编码,16到2047使用2个字节编码,所以应该将编号1到15留给频繁使用的字段。
可以指定的最小的编号为1,最大为2^{29}-1或536,870,911。但是不能使用19000到19999之间的值,这些值是预留给protocol buffer的。
required
:必须赋值的字段optional
:可有可无的字段repeated
:可重复字段(变长字段)一个.proto文件可以定义多个消息类型:
message SearchRequest {
string query = 1;
int32 page_number = 2;
int32 result_per_page = 3;
}
message SearchResponse {
...
}
.proto
文件也使用C/C++风格的注释语法//
message SearchRequest {
string query = 1;
int32 page_number = 2; // Which page number do we want?
int32 result_per_page = 3; // Number of results to return per page.
}
如果消息的字段被移除或注释掉,但是使用者可能重复使用字段编码,就有可能导致例如数据损坏、隐私漏洞等问题。一种避免此类问题的方法就是指明这些删除的字段是保留的。如果有用户使用这些字段的编号,protocol buffer编译器会发出告警。
message Foo {
reserved 2, 15, 9 to 11;
reserved "foo", "bar";
}
.proto
文件)对于C++,每一个.proto
文件经过编译之后都会对应的生成一个.h
和一个.cc
文件。
.proto Type | Notes | C++ Type |
---|---|---|
double | double | double |
float | float | float |
int32 | Uses variable-length encoding. Inefficient for encoding negative numbers – if your field is likely to have negative values, use sint32 instead. | int32 |
int64 | Uses variable-length encoding. Inefficient for encoding negative numbers – if your field is likely to have negative values, use sint64 instead. | int64 |
uint32 | Uses variable-length encoding. | uint32 |
uint64 | Uses variable-length encoding. | uint64 |
sint32 | Uses variable-length encoding. Signed int value. These more efficiently encode negative numbers than regular int32s. | int32 |
sint64 | Uses variable-length encoding. Signed int value. These more efficiently encode negative numbers than regular int64s. | int64 |
fixed32 | Always four bytes. More efficient than uint32 if values are often greater than 2^28 | uint32 |
fixed64 | Always eight bytes. More efficient than uint64 if values are often greater than 2^56 | uint64 |
sfixed32 | Always four bytes. | int32 |
sfixed64 | Always eight bytes. | int64 |
bool | bool | boolean |
string | A string must always contain UTF-8 encoded or 7-bit ASCII text. | string |
bytes | May contain any arbitrary sequence of bytes. | string |
如果没有指定默认值,则会使用系统默认值,对于string
默认值为空字符串,对于bool
默认值为false,对于数值类型
默认值为0,对于enum
默认值为定义中的第一个元素,对于repeated
默认值为空。
message SearchRequest {
string query = 1;
int32 page_number = 2;
int32 result_per_page = 3;
enum Corpus {
UNIVERSAL = 0;
WEB = 1;
IMAGES = 2;
LOCAL = 3;
NEWS = 4;
PRODUCTS = 5;
VIDEO = 6;
}
Corpus corpus = 4;
}
通过设置可选参数allow_alias
为true,就可以在枚举结构中使用别名(两个值元素值相同)
enum EnumAllowingAlias {
option allow_alias = true;
UNKNOWN = 0;
STARTED = 1;
RUNNING = 1;
}
enum EnumNotAllowingAlias {
UNKNOWN = 0;
STARTED = 1;
// RUNNING = 1; // Uncommenting this line will cause a compile error inside Google and a warning message outside.
}
由于枚举值采用varint编码,所以为了提高效率,不建议枚举值取负数。这些枚举值可以在其他消息定义中重复使用。
可以使用一个消息的定义作为另一个消息的字段类型。
message SearchResponse {
repeated Result results = 1;
}
message Result {
string url = 1;
string title = 2;
repeated string snippets = 3;
}
就像C++的头文件一样,你还可以导入其他的.proto文件
import "myproject/other_protos.proto";
如果想要移动一个.proto
文件,但是又不想修改项目中import
部分的代码,可以在文件原先位置留一个空.proto
文件,然后使用import public
导入文件移动后的新位置:
// new.proto
// All definitions are moved here
// old.proto
// This is the proto that all clients are importing.
import public "new.proto";
import "other.proto";
// client.proto
import "old.proto";
// You use definitions from old.proto and new.proto, but not other.proto
在protocol中可以定义如下的嵌套类型
message SearchResponse {
message Result {
string url = 1;
string title = 2;
repeated string snippets = 3;
}
repeated Result results = 1;
}
如果在另外一个消息中需要使用Result
定义,则可以通过Parent.Type
来使用。
message SomeOtherMessage {
SearchResponse.Result result = 1;
}
protocol支持更深层次的嵌套和分组嵌套,但是为了结构清晰起见,不建议使用过深层次的嵌套。
message Outer { // Level 0
message MiddleAA { // Level 1
message Inner { // Level 2
int64 ival = 1;
bool booly = 2;
}
}
message MiddleBB { // Level 1
message Inner { // Level 2
int32 ival = 1;
bool booly = 2;
}
}
在实际的开发中会存在这样一种应用场景,既消息格式因为某些需求的变化而不得不进行必要的升级,但是有些使用原有消息格式的应用程序暂时又不能被立刻升级,这便要求我们在升级消息格式时要遵守一定的规则,从而可以保证基于新老消息格式的新老程序同时运行。规则如下:
Any
类型是一种不需要在.proto
文件中定义就可以直接使用的消息类型,使用前import google/protobuf/any.proto
文件即可。
import "google/protobuf/any.proto";
message ErrorStatus {
string message = 1;
repeated google.protobuf.Any details = 2;
}
C++使用PackFrom()
和UnpackTo()
方法来打包和解包Any
类型消息。
// Storing an arbitrary message type in Any.
NetworkErrorDetails details = ...;
ErrorStatus status;
status.add_details()->PackFrom(details);
// Reading an arbitrary message from Any.
ErrorStatus status = ...;
for (const Any& detail : status.details()) { if (detail.Is<NetworkErrorDetails>()) { NetworkErrorDetails network_error;
detail.UnpackTo(&network_error); ... processing network_error ... }
}
有点类似C++中的联合,就是消息中的多个字段类型在同一时刻只有一个字段会被使用,使用case()
或WhichOneof()
方法来检测哪个字段被使用了。
message SampleMessage {
oneof test_oneof {
string name = 4;
SubMessage sub_message = 9;
}
}
你可以添加除repeated
外任意类型的字段到Oneof
定义中
oneof字段只有最后被设置的字段才有效,即后面的set操作会覆盖前面的set操作
SampleMessage message;
message.set_name("name");
CHECK(message.has_name());
message.mutable_sub_message(); // Will clear name field.
CHECK(!message.has_name());
repeated
的如果使用C++要防止内存泄露,即后面的set操作会覆盖之前的set操作,导致前面设置的字段对象发生析构,要注意字段对象的指针操作
SampleMessage message;
SubMessage* sub_message = message.mutable_sub_message();
message.set_name("name"); // Will delete sub_message
sub_message->set_... // Crashes her
如果使用C++的Swap()
方法交换两条oneof消息,两条消息都不会保存之前的字段
SampleMessage msg1;
msg1.set_name("name");
SampleMessage msg2;
msg2.mutable_sub_message();
msg1.swap(&msg2);
CHECK(msg1.has_sub_message());
CHECK(msg2.has_name());
添加或删除oneof
字段的时候要注意,如果检测到oneof
字段的返回值是None
/NOT_SET
,这意味着oneof
没有被设置或者设置了一个不同版本的oneof
的字段,但是没有办法能够区分这两种情况,因为没有办法确认一个未知的字段是否是一个oneof
的成员。
protocol buffers提供了简介的语法来实现map类型:
map<key_type, value_type> map_field = N;
key_type
可以是除浮点指针或bytes
外的其他基本类型,value_type
可以是任意类型
map<string, Project> projects = 3;
map语法下面的表达方式在线性上是等价的,所以即使protocol buffers没有实现maps数据结构也不会影响数据的处理:
message MapFieldEntry {
key_type key = 1;
value_type value = 2;
}
repeated MapFieldEntry map_field = N;
类似C++的命名空间,用来防止名称冲突
package foo.bar;
message Open { ... }
你可以使用包说明符来定义你的消息字段:
message Foo {
...
foo.bar.Open open = 1;
...
}
如果想在RPC系统中使用消息类型,就需要在.proto
文件中定义RPC服务接口,然后使用编译器生成对应语言的存根。
service SearchService {
rpc Search (SearchRequest) returns (SearchResponse);
}
Proto3支持JSON格式的编码。编码后的JSON数据的如果没有值或值为空,解析时protocol buffer将会使用默认值,在对JSON编码时可以节省空间。
proto3 | JSON | JSON example | Notes |
---|---|---|---|
message | object | {"fBar": v, "g": null, …} | Generates JSON objects. Message field names are mapped to lowerCamelCase and become JSON object keys. null is accepted and treated as the default value of the corresponding field type. |
enum | string | "FOO_BAR" | The name of the enum value as specified in proto is used. |
map< K,V> | object | {"k": v, …} | All keys are converted to strings. |
repeated V | array | [v, …] | null is accepted as the empty list []. |
bool | true, false | true, false | |
string | string | "Hello World!" | |
bytes | base64 string | "YWJjMTIzIT8kKiYoKSctPUB+" | |
int32, fixed32, uint32 | number | 1, -10, 0 | JSON value will be a decimal number. Either numbers or strings are accepted. |
int64, fixed64, uint64 | string | "1", "-10" | JSON value will be a decimal string. Either numbers or strings are accepted. |
float, double | number | 1.1, -10.0, 0, "NaN", "Infinity" | JSON value will be a number or one of the special string values "NaN", "Infinity", and "-Infinity". Either numbers or strings are accepted. Exponent notation is also accepted. |
Any | object | {"@type": "url", "f": v, … } | If the Any contains a value that has a special JSON mapping, it will be converted as follows: {"@type": xxx,<wbr style="box-sizing: inherit;"> "value": yyy} . Otherwise, the value will be converted into a JSON object, and the "@type" field will be inserted to indicate the actual data type. |
Timestamp | string | "1972-01-01T10:00:20.021Z" | Uses RFC 3339, where generated output will always be Z-normalized and uses 0, 3, 6 or 9 fractional digits. |
Duration | string | "1.000340012s", "1s" | Generated output always contains 0, 3, 6, or 9 fractional digits, depending on required precision. Accepted are any fractional digits (also none) as long as they fit into nano-seconds precision. |
Struct | object | { … } | Any JSON object. See struct.proto. |
Wrapper types | various types | 2, "2", "foo", true, "true", null, 0, … | Wrappers use the same representation in JSON as the wrapped primitive type, except that null is allowed and preserved during data conversion and transfer. |
FieldMask | string | "f.fooBar,h" | See fieldmask.proto. |
ListValue | array | [foo, bar, …] | |
Value | value | Any JSON value | |
NullValue | null | JSON null |
Protocol Buffer允许我们在.proto文件中定义一些常用的选项,这样可以指示Protocol Buffer编译器帮助我们生成更为匹配的目标语言代码。Protocol Buffer内置的选项被分为以下三个级别:
文件级别,这样的选项将影响当前文件中定义的所有消息和枚举。
消息级别,这样的选项仅影响某个消息及其包含的所有字段。
字段级别,这样的选项仅仅响应与其相关的字段。
下面将给出一些常用的Protocol Buffer选项。
optimize_for
(文件选项):可以设置的值有SPEED
、CODE_SIZE
或 LITE_RUNTIME
,不同的选项会以下述方式影响C++代码的生成(option optimize_for = CODE_SIZE;
)。
SPEED (default): protocol buffer编译器将会生成序列化,语法分析和其他高效操作消息类型的方式.这也是最高的优化选项.确定是生成的代码比较大.
CODE_SIZE: protocol buffer编译器将会生成最小的类,确定是比SPEED运行要慢
LITE_RUNTIME: protocol buffer编译器将会生成只依赖"lite" runtime library (libprotobuf-lite instead of libprotobuf)的类. lite运行时库比整个库更小但是删除了例如descriptors 和 reflection等特性. 这个选项通常用于手机平台的优化.
cc_enable_arenas
(文件选项):生成的C++代码启用arena allocation内存管理deprecated
(文件选项):
Protocol Buffer官方文档
Protocol Buffer使用简介
Protocol Buffer技术详解(语言规范)
Protocol Buffers官方文档(proto3语言指南)
标签:XA 建议 size 字段 googl 枚举 理解 project rpc
原文地址:https://www.cnblogs.com/silvermagic/p/9087539.html