美文网首页我爱编程
小白谈分布式数据库设计2——存储模块设计

小白谈分布式数据库设计2——存储模块设计

作者: 谜碌小孩 | 来源:发表于2018-03-06 10:22 被阅读0次

    存储模块

    我们将存储模块分为内存存储和磁盘存储。借鉴Hbase和Cassandra的设计思想,我们先对操作写日志(CommitLog),然后将写入的数据先存储到内存中的某个结构中(Memtable),当满足一定的条件时(大小时间等限制),将Memtable按照我们定义的格式写入SSTable.这里主要是借鉴Cassandra的存储结构,仍然以行为单位进行存储.Hbase的列存储,每一个单独的cell都存储了大量重复的字段,如果表的列设计过多,会浪费大量的存储.我们先做大量的接口设计
    对于内存中的数据,我们需要先设计两个功能型接口,HeapSize和Snapshot。功能型接口,就是一看接口名就知道他的功能是什么,顾名思义,HeapSize就是获取当前对象占用内存,Snapshot就是获取一个快照,类似于深度克隆。

    public interface HeapSize {
        long heapSize();
    }
    
    public interface Snapshot<T> {
        T snapshot();
    }
    

    列单元Colum设计

    最底层存储单元,我们设计IColumn接口,方法暂定为获取ColumnName,ColumnValue,Timestamp,Type(插入,删除);

    public interface IColumn extends Comparable<IColumn>{
         byte[] getColumnName();
         byte[] getColumnValue();
         long getTimestamp();
    
        Type getType();
    
        enum Type {
            Put((byte) 4),
    
            Delete((byte) 8),
    
            DeleteColumnFamily((byte) 12);
    
            private final byte code;
    
            Type(final byte c) {
                this.code = c;
            }
    
            public byte getCode() {
                return this.code;
            }
        }
    }
    

    Rowkey设计

    至于Rowkey的设计,暂时还没有考虑完善,暂且定位一个获取key值的接口。

    public interface Rowkey extends Comparable<Rowkey>{
        byte[] getKey();
    }
    

    ColumFamily设计

    ColumnFamily,代表一列数据,数据结构采用ConcurrentSkipListMap<String, IColumn>;

    public interface IColumnFamily extends HeapSize{
        void add(String key, IColumn column);
        IColumn get(String key);
        Map<String, IColumn> getFamily();
    }
    

    Memtable设计

    每个表在内存中的数据用Memtable表示,简单表示就是Map<Rowkey, ColumnFamily>;
    这里需要注意的一点是,Memtable在写磁盘的时候,真是写入的数据是Memtable的副本。读写要如何进行。这里我们的策略是写入到新的Mentable中,读取数据可以到Mentable中读取,但是不能修改。
    达到一定条件,使用特定的线程池来写磁盘;

    public class Memtable implements HeapSize, Snapshot<Memtable> {
        private NavigableMap<Rowkey, IColumnFamily> memtable = new ConcurrentSkipListMap<>();
    
        private volatile boolean flush;
        private transient long heapSize;
        
        private SSTableWirter<Memtable> ssTableWirter;
    
        public Memtable(NavigableMap<Rowkey, IColumnFamily> memtable) {
            this.memtable = memtable;
        }
    
        public void add(Rowkey rowKey, IColumn column){
            if(flush) return;
            IColumnFamily old = memtable.get(rowKey);
            if(old == null) {
                IColumnFamily newFamily = new ColumnFamily();
                newFamily.add(new String(column.getColumnName()), column);
                memtable.put(rowKey, newFamily);
            }else {
                old.add(new String(column.getColumnName()), column);
            }
        }
    
        public long getHeapSize() {
            return heapSize;
        }
    
        public IColumnFamily getFamily(Rowkey rowKey){
            return memtable.get(rowKey);
        }
    
        public NavigableMap<Rowkey, IColumnFamily> getMemtable() {
            return memtable;
        }
    
        /**
         * if ready to flush to disk
         * @return
         */
        private boolean checkFlush() {
            return heapSize > 111;
        }
    
        private void flushToDisk(){
            Memtable snapshot = snapshot();
            flush = true;
            Constant.SERVICE.submit(new Runnable() {
                @Override
                public void run() {
                    ssTableWirter.write(snapshot);
                }
            });
        }
    
        @Override
        public long heapSize() {
            return heapSize;
        }
    
    
        @Override
        public Memtable snapshot() {
            NavigableMap<Rowkey, IColumnFamily> readOnly = new ConcurrentSkipListMap<>(memtable);
            return new Memtable(readOnly);
        }
    
    }
    

    磁盘存储SSTable

    SSTable的读写,这里使用装饰模式。IFileReader和IFileWriter包装IFile,SSTableReader和SSTableWriter又包装IFileReader和IFileWriter。SSTable中保存相应的SSTableReader和索引,来快速完成数据读取
    SSTable的写入与读取我们暂时只设计了接口,省去了具体的细节,比如文件的组织形式是B+Tree,而这样一整套内存和B+Tree的存储机制又称为LSM Tree。这些细节的代码,可以留着以后完成。并且上述所有的设计以及代码的细节都有很大的优化空间,不是可以一蹴而就的工作。

    public class SSTable {
        private IndexBlock indexBlock;
        private SSTableReader<IColumnFamily> tableReader;
        private volatile boolean isWritable;
    
        private String getTableName(){
            return null;
        }
        public IColumnFamily getFamily(Rowkey rowkey){
            return null;
        }
    }
    

    SSTableWriter

    public interface SSTableWirter<T> {
        void write(T t);
    }
    

    SSTableReader

    public interface SSTableReader<T> {
        T read(long start, long size);
    }
    

    相关文章

      网友评论

        本文标题:小白谈分布式数据库设计2——存储模块设计

        本文链接:https://www.haomeiwen.com/subject/widlfftx.html