Java基础:序列化的作用
By arthur503 -- 29 Oct 2013
看hadoop的时候,看到将数据序列化后用于进程间通信。不清楚为什么需要序列化才进行进程间通信,其他的方法不好么?
查了下资料,在c#的序列化究竟有什么用?中楼主也是相同的问题。
请大家看网上的这段话:
序列化和反序列化最主要的作用有:“把对象的字节序列永久地保存到硬盘上,通常存放在一个文件中 ”
上面是网友对c#序列化作用的解释,我怎么看不出来序列化有什么用呢?我自己的编写一个小程序,用c#的文件操作类也可以保存对象> 的数据啊,还要序列化做什么?
我的问题是:既然用c#的文件操作类也可以保存对象的数据,还要序列化做什么?另外,通过其他办法也可以实现网络间通信和进程间通信,那为什么非要序列化呢?序列化和传统的手段相比究竟有什么好处? 奥术引擎说“数据需要序列化以后才能在服务端和客户端之间传输”,这是不对的,难道别的方法就不能传输了吗?
回答如下:
序列化是用来通信的,服务端把数据序列化,发送到客户端,客户端把接收到的数据反序列化后对数据进行操作,完成后再序列化发送到服务端,服务端再反序列化数据后对数据进行操作。说白了,数据需要序列化以后才能在服务端和客户端之间传输。这个服务端和客户端的概念是广义的,可以在网络上,也可以在同一台机器的不同进程中,甚至在同一个进程中进行通信。在传统编程中,对象是通过调用栈间接的与客户端交互,但在面向服务的编程中,客户端永远都不会直接调用实例。不知道说的明不明白。
好吧,我说的确实不够明白,你问的是为什么需要序列化,我只是说了序列化的一个应用。那我就来说说序列化的好处吧。不序列化也可以传输,但是无法跨平台,安全性也无法保障。我说的是面向服务编程中的作用,在传统编程中,你在表示层实例化一个业务对象,然后调用业务对象中的方法,你想过为什么能这样调用吗?这样做耦合度太高,很不好。如果序列化以后通过特定的协议传输数据就不一样了,表示层通过代理或通道向服务层发送特定的数据格式,这个数据就是序列化以后的,比如XML,服务端接收到以后要进行反序列化,生成服务端可识别的数据格式,比如一个类,然后对数据进行操作,再序列化发送到客户端,客户端再反序列化。这样客户端可以使用和服务端完全不同的开发平台,只要它能够对xml数据进行反序列化,而xml是具有工业标准的数据格式,基本各平台都支持。这也适用于在进程间通信。如果在进程内通信,也可以做到更高的安全性,对象不再通过调用栈交互,而是通过代理或通道。
另外,在Hadoop深入学习:InputFormat组件中讲到InputSplit的作用时说:
InputSplit主要有以下特点:
1)、逻辑分片,之前我们已经学习过split和block的对应关系和区别,split只是在逻辑上对数据分片,并不会在磁盘上讲数据切分成split物理分片,实际上数据在HDFS上还是以block为基本单位来存储数据的。InputSplit只记录了Mapper要处理的数据的元数据信息,如起始位置、长度和所在的节点;
2)、可序列化,在Hadoop中,序列化主要起两个作用,进程间通信和数据持久化存储。在这里,InputSplit主要用于进程间的通信。
参考资料: