2019-01-13

tools

Apache HBase - 分布式列式数据库

项目简介

Apache HBase是一个开源的分布式、版本化、面向列的NoSQL数据库，建立在Apache Hadoop之上。HBase的设计灵感来源于Google的BigTable论文，提供了类似BigTable的功能。它能够在普通硬件上线性扩展到数千个节点，存储数十亿行和数百万列的稀疏数据。

HBase适合存储大量稀疏数据，支持实时读写操作，常用于需要快速随机访问大量数据的场景。它与Hadoop生态系统紧密集成，可以作为MapReduce作业的数据源和输出目标。

主要特性

线性扩展：支持从几台服务器到数千台服务器的扩展
自动故障转移：RegionServer故障时自动重新分配数据
Hadoop集成：与HDFS、MapReduce、Spark等无缝集成
强一致性：提供强一致性的读写操作
版本化数据：支持数据的多个版本存储
压缩支持：内置多种数据压缩算法

项目原理

核心架构

HBase架构
├── HMaster (主服务器)
│   ├── Region分配管理
│   ├── Schema变更处理
│   └── 负载均衡控制
├── RegionServer (区域服务器)
│   ├── Region管理
│   ├── MemStore (内存存储)
│   ├── HFile (存储文件)
│   └── WAL (预写日志)
├── ZooKeeper
│   ├── 集群协调
│   ├── 配置管理
│   └── 故障检测
└── HDFS (分布式文件系统)
    ├── HFile存储
    ├── WAL存储
    └── 元数据存储

数据模型

Table（表）：

HBase中的最高级别数据结构
包含多个行，按行键排序

Row（行）：

由唯一的行键（Row Key）标识
包含一个或多个列族
数据按行键字典序存储

Column Family（列族）：

列的逻辑分组
物理存储单位
创建表时必须定义

Column（列）：

列族下的具体列
由列族名:列限定符组成
可以动态添加

Cell（单元格）：

行、列族、列、时间戳的交集
存储实际数据值
支持多个版本

Region分割机制

HBase表按行键范围水平分割成Region：

每个Region包含连续的行键范围
Region大小达到阈值时自动分割
Region分布在不同的RegionServer上

使用场景

1. 实时数据访问

需要毫秒级响应时间的大数据随机读写场景。

2. 时序数据存储

存储大量的时间序列数据，如监控数据、日志数据等。

3. 内容存储系统

存储文档、图片元数据等非结构化数据。

4. 推荐系统

存储用户画像、物品特征等推荐算法所需数据。

5. 消息系统

构建大规模的消息存储和检索系统。

具体案例

案例1：基本数据操作

import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.conf.Configuration;

public class HBaseExample {
    private static Configuration config = HBaseConfiguration.create();
    private static Connection connection;
    
    static {
        try {
            config.set("hbase.zookeeper.quorum", "localhost:2181");
            config.set("hbase.zookeeper.property.clientPort", "2181");
            connection = ConnectionFactory.createConnection(config);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
    
    // 创建表
    public static void createTable(String tableName, String[] columnFamilies) throws Exception {
        Admin admin = connection.getAdmin();
        
        TableName table = TableName.valueOf(tableName);
        if (admin.tableExists(table)) {
            System.out.println("表 " + tableName + " 已存在");
            admin.close();
            return;
        }
        
        TableDescriptorBuilder tableBuilder = TableDescriptorBuilder.newBuilder(table);
        
        for (String cf : columnFamilies) {
            ColumnFamilyDescriptor cfDesc = ColumnFamilyDescriptorBuilder
                .newBuilder(Bytes.toBytes(cf))
                .setMaxVersions(3)
                .setTimeToLive(86400) // 1天TTL
                .setCompressionType(Compression.Algorithm.SNAPPY)
                .build();
            tableBuilder.setColumnFamily(cfDesc);
        }
        
        admin.createTable(tableBuilder.build());
        System.out.println("表 " + tableName + " 创建成功");
        admin.close();
    }
    
    // 插入数据
    public static void putData(String tableName, String rowKey, String columnFamily, 
                              String column, String value) throws Exception {
        Table table = connection.getTable(TableName.valueOf(tableName));
        
        Put put = new Put(Bytes.toBytes(rowKey));
        put.addColumn(Bytes.toBytes(columnFamily), Bytes.toBytes(column), Bytes.toBytes(value));
        
        table.put(put);
        System.out.println("数据插入成功: " + rowKey + " -> " + columnFamily + ":" + column + " = " + value);
        table.close();
    }
    
    // 批量插入数据
    public static void batchPutData(String tableName, List<UserData> userData) throws Exception {
        Table table = connection.getTable(TableName.valueOf(tableName));
        
        List<Put> puts = new ArrayList<>();
        for (UserData user : userData) {
            Put put = new Put(Bytes.toBytes(user.getUserId()));
            
            // 基本信息列族
            put.addColumn(Bytes.toBytes("basic"), Bytes.toBytes("name"), Bytes.toBytes(user.getName()));
            put.addColumn(Bytes.toBytes("basic"), Bytes.toBytes("email"), Bytes.toBytes(user.getEmail()));
            put.addColumn(Bytes.toBytes("basic"), Bytes.toBytes("age"), Bytes.toBytes(user.getAge()));
            
            // 偏好信息列族
            if (user.getPreferences() != null) {
                for (Map.Entry<String, String> pref : user.getPreferences().entrySet()) {
                    put.addColumn(Bytes.toBytes("preferences"), 
                                Bytes.toBytes(pref.getKey()), 
                                Bytes.toBytes(pref.getValue()));
                }
            }
            
            puts.add(put);
        }
        
        table.put(puts);
        System.out.println("批量插入 " + puts.size() + " 条用户数据");
        table.close();
    }
    
    // 获取数据
    public static void getData(String tableName, String rowKey) throws Exception {
        Table table = connection.getTable(TableName.valueOf(tableName));
        
        Get get = new Get(Bytes.toBytes(rowKey));
        Result result = table.get(get);
        
        if (!result.isEmpty()) {
            System.out.println("行键: " + rowKey);
            
            for (Cell cell : result.listCells()) {
                String cf = Bytes.toString(CellUtil.cloneFamily(cell));
                String column = Bytes.toString(CellUtil.cloneQualifier(cell));
                String value = Bytes.toString(CellUtil.cloneValue(cell));
                long timestamp = cell.getTimestamp();
                
                System.out.printf("  %s:%s = %s (时间戳: %d)%n", cf, column, value, timestamp);
            }
        } else {
            System.out.println("没有找到行键为 " + rowKey + " 的数据");
        }
        
        table.close();
    }
    
    // 扫描数据
    public static void scanData(String tableName, String startRow, String endRow) throws Exception {
        Table table = connection.getTable(TableName.valueOf(tableName));
        
        Scan scan = new Scan();
        if (startRow != null) scan.withStartRow(Bytes.toBytes(startRow));
        if (endRow != null) scan.withStopRow(Bytes.toBytes(endRow));
        
        // 设置缓存和批次大小
        scan.setCaching(1000);
        scan.setBatch(100);
        
        ResultScanner scanner = table.getScanner(scan);
        
        int count = 0;
        for (Result result : scanner) {
            String rowKey = Bytes.toString(result.getRow());
            System.out.println("行键: " + rowKey);
            
            for (Cell cell : result.listCells()) {
                String cf = Bytes.toString(CellUtil.cloneFamily(cell));
                String column = Bytes.toString(CellUtil.cloneQualifier(cell));
                String value = Bytes.toString(CellUtil.cloneValue(cell));
                
                System.out.printf("  %s:%s = %s%n", cf, column, value);
            }
            
            count++;
            if (count >= 10) break; // 限制输出数量
        }
        
        scanner.close();
        table.close();
        System.out.println("扫描完成，共 " + count + " 行数据");
    }
    
    // 删除数据
    public static void deleteData(String tableName, String rowKey) throws Exception {
        Table table = connection.getTable(TableName.valueOf(tableName));
        
        Delete delete = new Delete(Bytes.toBytes(rowKey));
        table.delete(delete);
        
        System.out.println("删除行键 " + rowKey + " 的数据");
        table.close();
    }
}

案例2：时序数据存储

// 时序数据模型
public class TimeSeriesData {
    private String deviceId;
    private long timestamp;
    private Map<String, Double> metrics;
    
    // 构造函数和getter/setter
    public TimeSeriesData(String deviceId, long timestamp) {
        this.deviceId = deviceId;
        this.timestamp = timestamp;
        this.metrics = new HashMap<>();
    }
    
    public void addMetric(String name, Double value) {
        metrics.put(name, value);
    }
}

// 时序数据服务
public class TimeSeriesService {
    private static final String TABLE_NAME = "device_metrics";
    private Connection connection;
    
    public TimeSeriesService(Connection connection) {
        this.connection = connection;
    }
    
    // 创建时序数据表
    public void createTimeSeriesTable() throws Exception {
        Admin admin = connection.getAdmin();
        TableName tableName = TableName.valueOf(TABLE_NAME);
        
        if (admin.tableExists(tableName)) {
            System.out.println("表已存在: " + TABLE_NAME);
            return;
        }
        
        TableDescriptorBuilder builder = TableDescriptorBuilder.newBuilder(tableName);
        
        // 设置预分区
        byte[][] splitKeys = generateSplitKeys();
        
        // 配置列族
        ColumnFamilyDescriptor metricsFamily = ColumnFamilyDescriptorBuilder
            .newBuilder(Bytes.toBytes("metrics"))
            .setMaxVersions(1)
            .setTimeToLive(30 * 24 * 3600) // 30天TTL
            .setCompressionType(Compression.Algorithm.SNAPPY)
            .setBloomFilterType(BloomType.ROW)
            .build();
        
        builder.setColumnFamily(metricsFamily);
        
        admin.createTable(builder.build(), splitKeys);
        System.out.println("时序数据表创建成功");
        admin.close();
    }
    
    // 生成预分区键
    private byte[][] generateSplitKeys() {
        String[] devices = {"device001", "device002", "device003", "device004", "device005"};
        byte[][] splitKeys = new byte[devices.length - 1][];
        
        for (int i = 0; i < devices.length - 1; i++) {
            splitKeys[i] = Bytes.toBytes(devices[i]);
        }
        
        return splitKeys;
    }
    
    // 插入时序数据
    public void insertTimeSeriesData(TimeSeriesData data) throws Exception {
        Table table = connection.getTable(TableName.valueOf(TABLE_NAME));
        
        // 构造行键: deviceId + 反转时间戳 (用于时间倒序查询)
        String rowKey = data.getDeviceId() + "_" + (Long.MAX_VALUE - data.getTimestamp());
        
        Put put = new Put(Bytes.toBytes(rowKey));
        
        // 添加时间戳
        put.addColumn(Bytes.toBytes("metrics"), Bytes.toBytes("timestamp"), 
                     Bytes.toBytes(data.getTimestamp()));
        
        // 添加指标数据
        for (Map.Entry<String, Double> metric : data.getMetrics().entrySet()) {
            put.addColumn(Bytes.toBytes("metrics"), 
                         Bytes.toBytes(metric.getKey()), 
                         Bytes.toBytes(metric.getValue()));
        }
        
        table.put(put);
        table.close();
    }
    
    // 批量插入时序数据
    public void batchInsertTimeSeriesData(List<TimeSeriesData> dataList) throws Exception {
        Table table = connection.getTable(TableName.valueOf(TABLE_NAME));
        
        List<Put> puts = new ArrayList<>();
        for (TimeSeriesData data : dataList) {
            String rowKey = data.getDeviceId() + "_" + (Long.MAX_VALUE - data.getTimestamp());
            Put put = new Put(Bytes.toBytes(rowKey));
            
            put.addColumn(Bytes.toBytes("metrics"), Bytes.toBytes("timestamp"), 
                         Bytes.toBytes(data.getTimestamp()));
            
            for (Map.Entry<String, Double> metric : data.getMetrics().entrySet()) {
                put.addColumn(Bytes.toBytes("metrics"), 
                             Bytes.toBytes(metric.getKey()), 
                             Bytes.toBytes(metric.getValue()));
            }
            
            puts.add(put);
        }
        
        table.put(puts);
        table.close();
        System.out.println("批量插入时序数据: " + puts.size() + " 条");
    }
    
    // 查询设备指定时间范围的数据
    public List<TimeSeriesData> queryTimeRangeData(String deviceId, long startTime, long endTime) 
            throws Exception {
        Table table = connection.getTable(TableName.valueOf(TABLE_NAME));
        
        // 构造扫描范围
        String startRow = deviceId + "_" + (Long.MAX_VALUE - endTime);
        String endRow = deviceId + "_" + (Long.MAX_VALUE - startTime);
        
        Scan scan = new Scan();
        scan.withStartRow(Bytes.toBytes(startRow));
        scan.withStopRow(Bytes.toBytes(endRow));
        scan.addFamily(Bytes.toBytes("metrics"));
        
        ResultScanner scanner = table.getScanner(scan);
        List<TimeSeriesData> results = new ArrayList<>();
        
        for (Result result : scanner) {
            TimeSeriesData data = parseTimeSeriesResult(result);
            if (data != null) {
                results.add(data);
            }
        }
        
        scanner.close();
        table.close();
        
        return results;
    }
    
    // 解析查询结果
    private TimeSeriesData parseTimeSeriesResult(Result result) {
        byte[] timestampBytes = result.getValue(Bytes.toBytes("metrics"), Bytes.toBytes("timestamp"));
        if (timestampBytes == null) return null;
        
        long timestamp = Bytes.toLong(timestampBytes);
        String deviceId = extractDeviceIdFromRowKey(Bytes.toString(result.getRow()));
        
        TimeSeriesData data = new TimeSeriesData(deviceId, timestamp);
        
        for (Cell cell : result.listCells()) {
            String column = Bytes.toString(CellUtil.cloneQualifier(cell));
            if (!"timestamp".equals(column)) {
                double value = Bytes.toDouble(CellUtil.cloneValue(cell));
                data.addMetric(column, value);
            }
        }
        
        return data;
    }
    
    private String extractDeviceIdFromRowKey(String rowKey) {
        int lastUnderscore = rowKey.lastIndexOf("_");
        return rowKey.substring(0, lastUnderscore);
    }
}

案例3：协处理器应用

// 协处理器示例 - 自动统计计数
public class CountingCoprocessor implements RegionCoprocessor, RegionObserver {
    
    private static final String STATS_TABLE = "device_stats";
    
    @Override
    public Optional<RegionObserver> getRegionObserver() {
        return Optional.of(this);
    }
    
    @Override
    public void postPut(ObserverContext<RegionCoprocessorEnvironment> ctx, 
                       Put put, WALEdit edit, Durability durability) throws IOException {
        
        // 在数据插入后触发统计更新
        String tableName = ctx.getEnvironment().getRegionInfo().getTable().getNameAsString();
        if (TABLE_NAME.equals(tableName)) {
            updateDeviceStats(ctx, put);
        }
    }
    
    private void updateDeviceStats(ObserverContext<RegionCoprocessorEnvironment> ctx, Put put) {
        try {
            String rowKey = Bytes.toString(put.getRow());
            String deviceId = extractDeviceIdFromRowKey(rowKey);
            
            // 获取统计表连接
            Connection connection = ctx.getEnvironment().createConnection(ctx.getEnvironment().getConfiguration());
            Table statsTable = connection.getTable(TableName.valueOf(STATS_TABLE));
            
            // 增加设备数据点计数
            Increment increment = new Increment(Bytes.toBytes(deviceId));
            increment.addColumn(Bytes.toBytes("stats"), Bytes.toBytes("data_points"), 1L);
            increment.addColumn(Bytes.toBytes("stats"), Bytes.toBytes("last_update"), 
                              System.currentTimeMillis());
            
            statsTable.increment(increment);
            
            statsTable.close();
            connection.close();
            
        } catch (IOException e) {
            // 记录错误但不影响主要操作
            System.err.println("更新统计信息失败: " + e.getMessage());
        }
    }
    
    private String extractDeviceIdFromRowKey(String rowKey) {
        int lastUnderscore = rowKey.lastIndexOf("_");
        return rowKey.substring(0, lastUnderscore);
    }
}

案例4：性能监控和调优

// HBase性能监控工具
public class HBaseMonitor {
    private Connection connection;
    private Admin admin;
    
    public HBaseMonitor(Connection connection) throws IOException {
        this.connection = connection;
        this.admin = connection.getAdmin();
    }
    
    // 获取表统计信息
    public void getTableStats(String tableName) throws Exception {
        TableName table = TableName.valueOf(tableName);
        
        // 获取表描述信息
        TableDescriptor tableDesc = admin.getDescriptor(table);
        System.out.println("表名: " + tableName);
        System.out.println("列族数量: " + tableDesc.getColumnFamilyCount());
        
        // 获取Region信息
        List<RegionInfo> regions = admin.getRegions(table);
        System.out.println("Region数量: " + regions.size());
        
        // 获取RegionServer负载信息
        ClusterMetrics clusterMetrics = admin.getClusterMetrics();
        Map<ServerName, ServerMetrics> serverMetrics = clusterMetrics.getLiveServerMetrics();
        
        System.out.println("\n=== RegionServer状态 ===");
        for (Map.Entry<ServerName, ServerMetrics> entry : serverMetrics.entrySet()) {
            ServerName server = entry.getKey();
            ServerMetrics metrics = entry.getValue();
            
            System.out.printf("服务器: %s%n", server.getServerName());
            System.out.printf("  Region数量: %d%n", metrics.getRegionMetrics().size());
            System.out.printf("  请求数: %d%n", metrics.getRequestCount());
            System.out.printf("  读请求: %d%n", metrics.getReadRequestsCount());
            System.out.printf("  写请求: %d%n", metrics.getWriteRequestsCount());
        }
        
        // 分析Region分布
        analyzeRegionDistribution(regions, serverMetrics.keySet());
    }
    
    private void analyzeRegionDistribution(List<RegionInfo> regions, Set<ServerName> servers) {
        System.out.println("\n=== Region分布分析 ===");
        System.out.println("总Region数: " + regions.size());
        System.out.println("RegionServer数: " + servers.size());
        System.out.println("平均每服务器Region数: " + (regions.size() / servers.size()));
        
        // 检查热点Region
        for (RegionInfo region : regions) {
            byte[] startKey = region.getStartKey();
            byte[] endKey = region.getEndKey();
            
            if (startKey.length == 0 && endKey.length == 0) {
                System.out.println("发现单Region表，可能存在热点问题");
            }
        }
    }
    
    // 表压缩分析
    public void analyzeCompaction(String tableName) throws Exception {
        TableName table = TableName.valueOf(tableName);
        List<RegionInfo> regions = admin.getRegions(table);
        
        System.out.println("\n=== 压缩状态分析 ===");
        
        for (RegionInfo region : regions) {
            // 这里可以添加更详细的压缩状态检查
            System.out.println("Region: " + region.getEncodedName());
        }
        
        // 触发主压缩
        admin.majorCompact(table);
        System.out.println("已触发表 " + tableName + " 的主压缩");
    }
    
    // 预分区建议
    public void suggestPreSplitting(String tableName, int expectedRegions) {
        System.out.println("\n=== 预分区建议 ===");
        System.out.println("建议Region数量: " + expectedRegions);
        
        // 基于数据特征生成分区键
        byte[][] splitKeys = new byte[expectedRegions - 1][];
        for (int i = 1; i < expectedRegions; i++) {
            String splitKey = String.format("%02d", i * (100 / expectedRegions));
            splitKeys[i - 1] = Bytes.toBytes(splitKey);
            System.out.println("分区键 " + i + ": " + splitKey);
        }
    }
    
    public void close() throws IOException {
        if (admin != null) admin.close();
    }
}

性能优化建议

1. 行键设计

// 避免热点的行键设计
public class RowKeyDesign {
    
    // 使用散列前缀避免热点
    public static String generateRowKey(String deviceId, long timestamp) {
        // 使用设备ID的哈希值作为前缀
        int hash = Math.abs(deviceId.hashCode() % 100);
        String prefix = String.format("%02d", hash);
        
        return prefix + "_" + deviceId + "_" + (Long.MAX_VALUE - timestamp);
    }
    
    // 复合行键设计
    public static String generateCompositeRowKey(String userId, String eventType, long timestamp) {
        // 用户ID + 事件类型 + 反转时间戳
        return userId + "_" + eventType + "_" + (Long.MAX_VALUE - timestamp);
    }
}

2. 列族配置优化

// 优化列族配置
ColumnFamilyDescriptor optimizedFamily = ColumnFamilyDescriptorBuilder
    .newBuilder(Bytes.toBytes("cf"))
    .setMaxVersions(1) // 只保留最新版本
    .setTimeToLive(7 * 24 * 3600) // 设置TTL
    .setCompressionType(Compression.Algorithm.SNAPPY) // 启用压缩
    .setBloomFilterType(BloomType.ROW) // 启用布隆过滤器
    .setBlockCacheEnabled(true) // 启用块缓存
    .setBlocksize(64 * 1024) // 设置块大小
    .build();

3. 配置参数调优

<!-- hbase-site.xml -->
<configuration>
    <!-- RegionServer内存配置 -->
    <property>
        <name>hbase.regionserver.global.memstore.size</name>
        <value>0.4</value>
    </property>
    
    <!-- 块缓存配置 -->
    <property>
        <name>hfile.block.cache.size</name>
        <value>0.4</value>
    </property>
    
    <!-- 写入缓冲区大小 -->
    <property>
        <name>hbase.client.write.buffer</name>
        <value>2097152</value>
    </property>
    
    <!-- 扫描缓存大小 -->
    <property>
        <name>hbase.client.scanner.caching</name>
        <value>1000</value>
    </property>
</configuration>

Apache HBase作为Hadoop生态系统中的重要组成部分，其强大的列式存储和实时访问能力使其成为处理大规模结构化数据的理想选择。通过合理的数据建模和性能优化，HBase可以为企业提供高效、可扩展的NoSQL数据存储服务。

编外计划 - 日志

To be or not to be,--that is question.