Erlo

Apache Doris FE配置参数

2021-06-06 18:30:25 发布   849 浏览  
页面报错/反馈
收藏 点赞
今天刚整理完,提了RP到社区,现在这发布一下,大家可以参考

Doris FE配置参数

该文档主要介绍 FE 的相关配置项。

FE 的配置文件 fe.conf 通常存放在 FE 部署路径的 conf/ 目录下。 而在 0.14 版本中会引入另一个配置文件 fe_custom.conf。该配置文件用于记录用户在运行是动态配置并持久化的配置项。

FE 进程启动后,会先读取 fe.conf 中的配置项,之后再读取 fe_custom.conf 中的配置项。fe_custom.conf 中的配置项会覆盖 fe.conf 中相同的配置项。

fe_custom.conf 文件的位置可以在 fe.conf 通过 custom_config_dir 配置项配置。

查看配置项

FE 的配置项有两种方式进行查看:

  1. FE 前端页面查看

    在浏览器中打开 FE 前端页面 http://fe_host:fe_http_port/variable。在 Configure Info 中可以看到当前生效的 FE 配置项。

  2. 通过命令查看

    FE 启动后,可以在 MySQL 客户端中,通过以下命令查看 FE 的配置项:

    ADMIN SHOW FRONTEND CONFIG;

    结果中各列含义如下:

    • Key:配置项名称。

    • Value:当前配置项的值。

    • Type:配置项值类型,如果整型、字符串。

    • IsMutable:是否可以动态配置。如果为 true,表示该配置项可以在运行时进行动态配置。如果false,则表示该配置项只能在 fe.conf 中配置并且重启 FE 后生效。

    • MasterOnly:是否为 Master FE 节点独有的配置项。如果为 true,则表示该配置项仅在 Master FE 节点有意义,对其他类型的 FE 节点无意义。如果为 false,则表示该配置项在所有 FE 节点中均有意义。

    • Comment:配置项的描述。

设置配置项

FE 的配置项有两种方式进行配置:

  1. 静态配置

    conf/fe.conf 文件中添加和设置配置项。fe.conf 中的配置项会在 FE 进程启动时被读取。没有在 fe.conf 中的配置项将使用默认值。

  2. 通过 MySQL 协议动态配置

    FE 启动后,可以通过以下命令动态设置配置项。该命令需要管理员权限。

    ADMIN SET FRONTEND CONFIG ("fe_config_name" = "fe_config_value");

    不是所有配置项都支持动态配置。可以通过 ADMIN SHOW FRONTEND CONFIG; 命令结果中的 IsMutable 列查看是否支持动态配置。

    如果是修改 MasterOnly 的配置项,则该命令会直接转发给 Master FE 并且仅修改 Master FE 中对应的配置项。

    通过该方式修改的配置项将在 FE 进程重启后失效。

    更多该命令的帮助,可以通过 HELP ADMIN SET CONFIG; 命令查看。

  3. 通过 HTTP 协议动态配置

    具体请参阅 Set Config Action

    该方式也可以持久化修改后的配置项。配置项将持久化在 fe_custom.conf 文件中,在 FE 重启后仍会生效。

应用举例

  1. 修改 async_pending_load_task_pool_size

    通过 ADMIN SHOW FRONTEND CONFIG; 可以查看到该配置项不能动态配置(IsMutable 为 false)。则需要在 fe.conf 中添加:

    async_pending_load_task_pool_size=20

    之后重启 FE 进程以生效该配置。

  2. 修改 dynamic_partition_enable

    通过 ADMIN SHOW FRONTEND CONFIG; 可以查看到该配置项可以动态配置(IsMutable 为 true)。并且是 Master FE 独有配置。则首先我们可以连接到任意 FE,执行如下命令修改配置:

     ADMIN SET FRONTEND CONFIG ("dynamic_partition_enable" = "true");`

    之后可以通过如下命令查看修改后的值:

     set forward_to_master=true;
     ADMIN SHOW FRONTEND CONFIG;

    通过以上方式修改后,如果 Master FE 重启或进行了 Master 切换,则配置将失效。可以通过在 fe.conf 中直接添加配置项,并重启 FE 后,永久生效该配置项。

  3. 修改 max_distribution_pruner_recursion_depth

    通过 ADMIN SHOW FRONTEND CONFIG; 可以查看到该配置项可以动态配置(IsMutable 为 true)。并且不是 Master FE 独有配置。

    同样,我们可以通过动态修改配置的命令修改该配置。因为该配置不是 Master FE 独有配置,所以需要单独连接到不同的 FE,进行动态修改配置的操作,这样才能保证所有 FE 都使用了修改后的配置值

配置项列表

max_dynamic_partition_num

默认值:500

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

用于限制创建动态分区表时可以创建的最大分区数,避免一次创建过多分区。 数量由动态分区参数中的“开始”和“结束”决定。

grpc_max_message_size_bytes

默认值:1G

用于设置 GRPC 客户端通道的初始流窗口大小,也用于设置最大消息大小。当结果集较大时,可能需要增大该值。

enable_outfile_to_local

默认值:false 是否允许outfile函数将结果导出到本地磁盘

enable_access_file_without_broker

默认值:false

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

此配置用于在通过代理访问 bos 或其他云存储时尝试跳过代理

enable_bdbje_debug_mode

默认值:false

如果设置为 true,FE 将在 BDBJE 调试模式下启动,在Web页面System->bdbje 可以查看相关信息,否则不可以查看

enable_fe_heartbeat_by_thrift

默认值:false

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

这个配置是用来解决fe heartbeat response read_timeout问题的,当config设置为true时,master会通过thrift协议而不是http协议来获取fe heartbeat response。 为了保持与旧版本的兼容性,默认为false,在所有fe都升级之前不能将配置改为true。

enable_alpha_rowset

默认值:false

是否支持创建 alpha rowset。默认为 false,只应在紧急情况下使用,此配置应在未来的某个版本中删除

enable_http_server_v2

默认值:从官方0.14.0 release版之后默认是true,之前默认false

HTTP Server V2 由 SpringBoot 实现。它采用前后端分离的架构。只有启用httpv2才能用户使用新的前端UI界面

default_max_filter_ratio

默认值:0

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

可过滤数据的最大百分比(由于数据不规则等原因)默认值为0。表示严格模式,只要数据有一条被过滤掉整个导入失败

default_db_data_quota_bytes

默认值:1TB

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

用于设置默认数据库数据配额大小,设置单个数据库的配额大小可以使用:

 设置数据库数据量配额,单位为B/K/KB/M/MB/G/GB/T/TB/P/PB
 ALTER DATABASE db_name SET DATA QUOTA quota;
 查看配置
 show data (其他用法:HELP SHOW DATA)

enable_batch_delete_by_default

默认值:false

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

创建唯一表时是否添加删除标志列,具体原理参照官方文档:操作手册->数据导入->批量删除

recover_with_empty_tablet

默认值:false

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

在某些情况下,某些tablet可能会损坏或丢失所有副本。 此时数据已经丢失,损坏的tablet会导致整个查询失败,无法查询剩余的健康tablet。 在这种情况下,您可以将此配置设置为 true。 系统会将损坏的药片替换为空药片,以确保查询可以执行。 (但此时数据已经丢失,所以查询结果可能不准确)

max_allowed_in_element_num_of_delete

默认值:1024

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

用于限制delete语句中Predicate的元素个数

cache_result_max_row_count

默认值:3000

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:false

设置可以缓存的最大行数,详细的原理可以参考官方文档:操作手册->分区缓存

cache_last_version_interval_second

默认值:900

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:false

缓存结果时上一版本的最小间隔,该参数区分离线更新和实时更新

cache_enable_partition_mode

默认值:true

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:false

如果设置为true,fe 将从be cache 中获取数据,该选项适用于部分分区的实时更新。

cache_enable_sql_mode

默认值:true

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:false

如果设置为true,fe会启用sql结果缓存该选项适用于离线数据更新场景

  case1 case2 case3 case4
enable_sql_cache false true true false
enable_partition_cache false false true true

min_clone_task_timeout_sec 和 max_clone_task_timeout_sec

默认值:最小3分钟,最大两小时

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

min_clone_task_timeout_sec 和 max_clone_task_timeout_sec 用于限制克隆任务的最小和最大超时间。 一般情况下,克隆任务的超时时间是通过数据量和最小传输速度(5MB/s)来估计的。 但在特殊情况下,您可能需要手动设置这两个配置,以确保克隆任务不会因超时而失败。

agent_task_resend_wait_time_ms

默认值:5000

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

当代理任务的创建时间被设置的时候,此配置将决定是否重新发送代理任务, 当且仅当当前时间减去创建时间大于 agent_task_task_resend_wait_time_ms 时,ReportHandler可以重新发送代理任务。

该配置目前主要用来解决PUBLISH_VERSION代理任务的重复发送问题, 目前该配置的默认值是5000,是个实验值,由于把代理任务提交到代理任务队列和提交到be存在一定的时间延迟,所以调大该配置的值可以有效解决代理任务的重复发送问题,

但同时会导致提交失败或者执行失败的代理任务再次被执行的时间延长。

 

enable_odbc_table

默认值:false

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

是否启用ODBC表,默认不启用,在使用的时候需要手动配置启用,该参数可以通过:ADMIN SET FRONTEND CONFIG(“key”=“value”) 方式进行设置

enable_spark_load

默认值:false

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

是否临时启用spark load,默认不启用

enable_strict_storage_medium_check

默认值:false

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

如果设置为 true,FE 将在创建表时通过存储介质检查后端可用容量

参数 enable_strict_storage_medium_checkFalse 该参数只是一个“尽力而为”的设置。即使集群内没有设置 SSD 存储介质,也不会报错,而是自动存储在可用的数据目录中。 同样,如果 SSD 介质不可访问、空间不足,都可能导致数据初始直接存储在其他可用介质上。而数据到期迁移到 HDD 时,如果 HDD 介质不可访问、空间不足,也可能迁移失败(但是会不断尝试)。 如果FE参数 enable_strict_storage_medium_checkTrue 则当集群内没有设置 SSD 存储介质时,会报错 Failed to find enough host in all backends with storage medium is SSD

drop_backend_after_decommission

默认值:false

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

该配置用于控制系统在成功下线(Decommission) BE 后,是否 Drop 该 BE。如果为 true,则在 BE 成功下线后,会删除掉该BE节点。如果为 false,则在 BE 成功下线后,该 BE 会一直处于 DECOMMISSION 状态,但不会被删除。

该配置在某些场景下可以发挥作用。假设一个 Doris 集群的初始状态为每个 BE 节点有一块磁盘。运行一段时间后,系统进行了纵向扩容,即每个 BE 节点新增2块磁盘。因为 Doris 当前还不支持 BE 内部各磁盘间的数据均衡,所以会导致初始磁盘的数据量可能一直远高于新增磁盘的数据量。此时我们可以通过以下操作进行人工的磁盘间均衡:

  1. 将该配置项置为 false。

  2. 对某一个 BE 节点,执行 decommission 操作,该操作会将该 BE 上的数据全部迁移到其他节点中。

  3. decommission 操作完成后,该 BE 不会被删除。此时,取消掉该 BE 的 decommission 状态。则数据会开始从其他 BE 节点均衡回这个节点。此时,数据将会均匀的分布到该 BE 的所有磁盘上。

  4. 对所有 BE 节点依次执行 2,3 两个步骤,最终达到所有节点磁盘均衡的目的。

period_of_auto_resume_min

默认值:5 (s)

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

自动恢复Routine load的周期

max_tolerable_backend_down_num

默认值:0

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

只要有一个BE宕机,Routine Load就无法自动恢复

enable_materialized_view

默认值:true

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

该配置用于开启和关闭创建物化视图功能。如果设置为 true,则创建物化视图功能开启。用户可以通过 CREATE MATERIALIZED VIEW 命令创建物化视图。如果设置为 false,则无法创建物化视图。

如果在创建物化视图的时候报错 The materialized view is coming soonThe materialized view is disabled 则说明改配置被设置为了 false,创建物化视图功能关闭了。可以通过修改配置为 true 来启动创建物化视图功能。

该变量为动态配置,用户可以在 FE 进程启动后,通过命令修改配置。也可以通过修改 FE 的配置文件,重启 FE 来生效

check_java_version

默认值:false

如果设置为 true,Doris 将检查已编译和运行的 Java 版本是否兼容

max_running_rollup_job_num_per_table

默认值:1

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

控制Rollup作业并发限制

dynamic_partition_enable

默认值:true

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

是否启用动态分区,默认启用

dynamic_partition_check_interval_seconds

默认值:600秒,10分钟

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

检查动态分区的频率

disable_cluster_feature

默认值:true

是否可以动态配置:true

多集群功能将在 0.12 版本中弃用 将此配置设置为 true 将禁用与集群功能相关的所有操作,包括: 创建/删除集群 添加、释放BE/将BE添加到集群/停用集群balance 更改集群的后端数量 链接/迁移数据库

force_do_metadata_checkpoint

默认值:false

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

如果设置为 true,则无论 jvm 内存使用百分比如何,检查点线程都会创建检查点

metadata_checkpoint_memory_threshold

默认值:60 (60%)

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

如果 jvm 内存使用百分比(堆或旧内存池)超过此阈值,则检查点线程将无法工作以避免 OOM。

max_distribution_pruner_recursion_depth

默认值:100

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:false

这将限制哈希分布修剪器的最大递归深度。 例如:其中 a in(5 个元素)和 b in(4 个元素)和 c in(3 个元素)和 d in(2 个元素)。 a/b/c/d 是分布式列,所以递归深度为 5 * 4 * 3 * 2 = 120,大于 100, 因此该分发修剪器将不起作用,只会返回所有 buckets。 增加深度可以支持更多元素的分布修剪,但可能会消耗更多的 CPU

通过 ADMIN SHOW FRONTEND CONFIG; 可以查看到该配置项可以动态配置(IsMutable 为 true)。并且不是 Master FE 独有配置。

同样,我们可以通过动态修改配置的命令修改该配置。因为该配置不是 Master FE 独有配置,所以需要单独连接到不同的 FE,进行动态修改配置的操作,这样才能保证所有 FE 都使用了修改后的配置值

using_old_load_usage_pattern

默认值:false

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

如果设置为true,处理错误的insert stmt 仍将返回一个标签给用户。 用户可以使用此标签来检查加载作业的状态。 默认值为false,表示插入操作遇到错误,不带加载标签,直接抛出异常给用户客户端。

small_file_dir

默认值:DORIS_HOME_DIR + “/small_files”

保存小文件的目录

max_small_file_size_bytes

默认值:1M

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

SmallFileMgr 中单个文件存储的最大大小

max_small_file_number

默认值:100

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

SmallFileMgr 中存储的最大文件数

max_routine_load_task_num_per_be

默认值:5

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

每个 BE 的最大并发例Routine Load任务数。 这是为了限制发送到 BE 的Routine Load任务的数量,并且它也应该小于 BE config 'routine_load_thread_pool_size'(默认 10),这是 BE 上的Routine Load任务线程池大小。

max_routine_load_task_concurrent_num

默认值:5

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

单个Routine Load作业的最大并发例程加载任务数

max_routine_load_job_num

默认值:100

最大Routine Load作业数,包括 NEED_SCHEDULED, RUNNING, PAUSE

max_running_txn_num_per_db

默认值:100

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

这个配置主要是用来控制同一个 db 的并发导入个数的。

当集群中有过多的导入任务正在运行时,新提交的导入任务可能会报错:

 current running txns on db xxx is xx, larger than limit xx

该遇到该错误时,说明当前集群内正在运行的导入任务超过了该配置值。此时建议在业务侧进行等待并重试导入任务。

一般来说不推荐增大这个配置值。过高的并发数可能导致系统负载过大

enable_metric_calculator

默认值:true

如果设置为 true,指标收集器将作为守护程序计时器运行,以固定间隔收集指标

report_queue_size

默认值: 100

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

这个阈值是为了避免在 FE 中堆积过多的报告任务,可能会导致 OOM 异常。 , 等等..)。 并且一个BE每 1 分钟会报告一次tablet信息,因此无限制接收报告是不可接受的。以后我们会优化tablet报告的处理速度

不建议修改这个值

partition_rebalance_max_moves_num_per_selection

默认值:10

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

仅在使用 PartitionRebalancer 时有效 ,

partition_rebalance_move_expire_after_access

默认值:600 (s)

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

仅在使用 PartitionRebalancer 时有效。 如果更改,缓存的移动将被清除

tablet_rebalancer_type

默认值:BeLoad

是否为 Master FE 节点独有的配置项:true

rebalancer类型(忽略大小写):BeLoad、Partition。 如果类型解析失败,默认使用 BeLoad

max_balancing_tablets

默认值:100

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

如果 TabletScheduler 中的balance tablet数量超过 max_balancing_tablets,则不再进行balance检查

max_scheduling_tablets

默认值:2000

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

如果 TabletScheduler 中调度的tablet数量超过 max_scheduling_tablets, 则跳过检查。

disable_balance

默认值:false

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

如果设置为 true,TabletScheduler 将不会做balance

balance_load_score_threshold

默认值:0.1 (10%)

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

集群balance百分比的阈值,如果一个BE的负载分数比平均分数低10%,这个后端将被标记为低负载,如果负载分数比平均分数高10%,将被标记为高负载。

schedule_slot_num_per_path

默认值:2

tablet调度程序中每个路径的默认slot数量

tablet_repair_delay_factor_second

默认值:60 (s)

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

决定修复tablet前的延迟时间因素。 如果优先级为 VERY_HIGH,请立即修复。 HIGH,延迟 tablet_repair_delay_factor_second * 1; 正常:延迟 tablet_repair_delay_factor_second * 2; 低:延迟 tablet_repair_delay_factor_second * 3;

es_state_sync_interval_second

默认值:10

fe 会在每隔 es_state_sync_interval_secs 调用 es api 获取 es 索引分片信息

disable_hadoop_load

默认值:false

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

默认不禁用,将来不推荐使用 hadoop 集群load。 设置为 true 以禁用这种load方式。

db_used_data_quota_update_interval_secs

默认值:300 (s)

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

一个主守护线程将每 db_used_data_quota_update_interval_secs 更新数据库 txn 管理器的数据库使用数据配额

为了更好的数据导入性能,在数据导入之前的数据库已使用的数据量是否超出配额的检查中,我们并不实时计算数据库已经使用的数据量,而是获取后台线程周期性更新的值。

该配置用于设置更新数据库使用的数据量的值的时间间隔

disable_load_job

默认值:false

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

不禁用,如果这设置为 true

  • 调用开始 txn api 时,所有挂起的加载作业都将失败

  • 调用 commit txn api 时,所有准备加载作业都将失败

  • 所有提交的加载作业将等待发布

catalog_try_lock_timeout_ms

默认值:5000 (ms)

是否可以动态配置:true

元数据锁的 tryLock 超时配置。 通常它不需要改变,除非你需要测试一些东西。

max_query_retry_time

默认值:2

是否可以动态配置:true

查询重试次数。 如果我们遇到 RPC 异常并且没有将结果发送给用户,则可能会重试查询。 您可以减少此数字以避免雪崩灾难。

remote_fragment_exec_timeout_ms

默认值:5000 (ms)

是否可以动态配置:true

异步执行远程fragment的超时时间。 在正常情况下,异步远程fragment_将在短时间内执行。 如果系统处于高负载状态,请尝试将此超时设置更长的时间。

enable_local_replica_selection

默认值:false

是否可以动态配置:true

如果设置为 true,Planner 将尝试在与此前端相同的主机上选择tablet的副本。 在以下情况下,这可能会减少网络传输:

  1. N 个主机,部署了 N 个BE和 N 个FE。

  2. 数据有N个副本。

  3. 高并发查询均匀发送到所有Frontends

    在这种情况下,所有 Frontends 只能使用本地副本进行查询。

max_unfinished_load_job

默认值:1000

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

最大加载任务数,包括 PENDING、ETL、LOADING、QUORUM_FINISHED。 如果超过此数量,则不允许提交加载作业。

max_bytes_per_broker_scanner

默认值:3 * 1024 * 1024 * 1024L (3G)

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

broker scanner 程序可以在一个broker加载作业中处理的最大字节数。 通常,每个BE都有一个broker scanner程序。

enable_auth_check

默认值:true

如果设置为 false,则身份验证检查将被禁用,以防新权限系统出现问题。

tablet_stat_update_interval_second

默认值:300,(5分钟)

tablet状态更新间隔 所有FE将在每个时间间隔从所有BE获取tablet统计信息

storage_flood_stage_usage_percent

默认值:95 (95%)

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

storage_flood_stage_left_capacity_bytes

默认值:

 storage_flood_stage_usage_percent  : 95  (95%)
 
 storage_flood_stage_left_capacity_bytes :  1 * 1024 * 1024 * 1024 (1GB)

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

如果磁盘容量达到'storage_flood_stage_usage_percent'和'storage_flood_stage_left_capacity_bytes', 以下操作将被拒绝:

  1. load作业

  2. restore工作

storage_high_watermark_usage_percent

默认值:85 (85%)

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

storage_min_left_capacity_bytes

默认值: 2 * 1024 * 1024 * 1024 (2GB)

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

'storage_high_watermark_usage_percent' 限制BE端存储路径的最大容量使用百分比。 'storage_min_left_capacity_bytes' 限制BE端存储路径的最小剩余容量。 如果达到这两个限制,则不能选择此存储路径作为tablet存储目的地。 但是对于tablet恢复,我们可能会超过这些限制以尽可能保持数据完整性。

backup_job_default_timeout_ms

默认值:86400 * 1000 (1天)

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

备份作业的默认超时时间

with_k8s_certs

默认值:false

如果在本地使用 k8s 部署管理器,请将其设置为 true 并准备证书文件

dpp_hadoop_client_path

默认值:/lib/hadoop-client/hadoop/bin/hadoop

dpp_bytes_per_reduce

默认值:100 * 1024 * 1024L; // 100M

dpp_default_cluster

默认值:palo-dpp

dpp_default_config_str

默认值:{ "hadoop_configs : '" "mapred.job.priority=NORMAL;" "mapred.job.map.capacity=50;" "mapred.job.reduce.capacity=50;" "mapred.hce.replace.streaming=false;" "abaci.long.stored.job=true;" "dce.shuffle.enable=false;" "dfs.client.authserver.force_stop=true;" "dfs.client.auth.method=0" "'}

dpp_config_str

默认值:{palo-dpp : {" + "hadoop_palo_path : '/dir'," + "hadoop_configs : '" + "fs.default.name=hdfs://host:port;" + "mapred.job.tracker=host:port;" + "hadoop.job.ugi=user,password" + "'}" + "}

enable_deploy_manager

默认值:disable

如果使用第三方部署管理器部署 Doris,则设置为 true

有效的选项是:

  • disable:没有部署管理器

  • k8s:Kubernetes

  • ambari:Ambari

  • local:本地文件(用于测试或 Boxer2 BCC 版本)

enable_token_check

默认值:true

为了向前兼容,稍后将被删除。 下载image文件时检查令牌。

expr_depth_limit

默认值:3000

是否可以动态配置:true

限制 expr 树的深度。 超过此限制可能会导致在持有 db read lock 时分析时间过长。 如果您知道自己在做什么,请不要设置此项。

expr_children_limit

默认值:10000

是否可以动态配置:true

限制 expr 树的 expr 子节点的数量。 超过此限制可能会导致在持有数据库读锁时分析时间过长。 如果您知道自己在做什么,请不要设置此项。

proxy_auth_magic_prefix

默认值:x@8

proxy_auth_enable

默认值:false

meta_publish_timeout_ms

默认值:1000ms

默认元数据发布超时时间

disable_colocate_balance

默认值:false

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

  • 此配置可以设置为 true 以禁用自动colocate 表的重新定位和平衡。 如果 'disable_colocate_balance' 设置为 true,则 ColocateTableBalancer 将不会重新定位和平衡并置表。 注意: 一般情况下,根本不需要关闭平衡。 因为一旦关闭平衡,不稳定的colocate表可能无法恢复 最终查询时无法使用colocate 计划。

query_colocate_join_memory_limit_penalty_factor

默认值:1

是否可以动态配置:true

colocote join PlanFragment instance的memory_limit = exec_mem_limit / min (query_colocate_join_memory_limit_penalty_factor, instance_num)

max_connection_scheduler_threads_num

默认值:4096

查询请求调度器中的最大线程数。

前的策略是,有请求过来,就为其单独申请一个线程进行服务

qe_max_connection

默认值:1024

每个 FE 的最大连接数

check_consistency_default_timeout_second

默认值:600 (10分钟)

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

单个一致性检查任务的默认超时。 设置足够长以适合您的tablet大小。

consistency_check_start_time

默认值:23

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

一致性检查开始时间

一致性检查器将从 consistency_check_start_time 运行到 consistency_check_end_time。 默认为 23:00 至 04:00

consistency_check_end_time

默认值:04

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

一致性检查结束时间

一致性检查器将从 consistency_check_start_time 运行到 consistency_check_end_time。 默认为 23:00 至 04:00

export_tablet_num_per_task

默认值:5

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

每个导出查询计划的tablet数量

export_task_default_timeout_second

默认值:2 * 3600 (2小时)

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

导出作业的默认超时时间

export_running_job_num_limit

默认值:5

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

运行导出作业的并发限制。 默认值为 5。 0 表示无限制

export_checker_interval_second

默认值:5

导出检查器的运行间隔

max_broker_concurrency

默认值:10

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

broker scanner的最大并发数。 如果您知道自己在做什么,请不要设置此项。

min_bytes_per_broker_scanner

默认值:67108864L (64M)

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

单个broker scanner将读取的最大字节数。 如果您知道自己在做什么,请不要设置此项。

catalog_trash_expire_second

默认值:86400L (1天)

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

删除数据库(表/分区)后,您可以使用 RECOVER stmt 恢复它。 这指定了最大数据保留时间。 一段时间后,数据将被永久删除。

storage_cooldown_second

默认值:30 * 24 * 3600L (30天)

创建表(或分区)时,可以指定其存储介质(HDD 或 SSD)。 如果设置为 SSD,这将指定tablet在 SSD 上停留的默认时间。 之后,tablet将自动移动到 HDD。 您可以在 CREATE TABLE stmt 中设置存储冷却时间。

default_storage_medium

默认值:HDD

创建表(或分区)时,可以指定其存储介质(HDD 或 SSD)。 如果未设置,则指定创建时的默认介质。

max_backend_down_time_second

默认值:3600 (1小时)

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

如果BE关闭了 max_backend_down_time_second,将触发 BACKEND_DOWN 事件。 如果您知道自己在做什么,请不要设置此项。

alter_table_timeout_second

默认值:86400 (1天)

是否可以动态配置:true

是否为 Master FE 节点独有的配置项:true

ALTER TABLE 请求的最大超时时间。 设置足够长以适合您的表格数据大小

capacity_used_percent_high_water

默认值:0.75 (75%)

是否可

标签: 棒极了
登录查看全部

参与评论

评论留言

还没有评论留言,赶紧来抢楼吧~~

手机查看

返回顶部

给这篇文章打个标签吧~

棒极了 糟糕透顶 好文章 PHP JAVA JS 小程序 Python SEO MySql 确认