Mailing List Archive

stonithプラグインのパラメータについて
山内さん

こんにちは、福田です。
その後、こちらではpacemaker1.1.12 build:561c4cf がとりあえず動いている状態です。

済みませんが、stonithプラグインのパラメータについて質問させて下さい。

stonith-helperのパラメータについてです。

2013/8/3のOSC2013の資料には、standby_wait_time秒スリープして相撃ちを防止すると書いてあります。
以前参考に頂いたコンフィグには、fencing_topologyを記述して、pcmk_reboot_retriesとpcmk_reboot_timeoutというパラメータが入って、standby_wait_timeは抜けていたかと思います。

pacemaker1.1.12ではstandby_wait_timeの記述は必要無いのでしょうか。

こちらでは、今次のようなコンフィグファイルを作っています。

### Cluster Option ###
property \
no-quorum-policy="ignore" \
stonith-enabled="true" \
startup-fencing="false" \
stonith-timeout="710s" \
crmd-transition-delay="2s"

### Resource Default ###
rsc_defaults \
resource-stickiness="INFINITY" \
migration-threshold="1"

### Group Configuration ###
group HAvarnish \
vip_208 \
varnishd

group grpStonith1 \
Stonith1-1 \
Stonith1-2 \
Stonith1-3

group grpStonith2 \
Stonith2-1 \
Stonith2-2 \
Stonith2-3

### Clone Configuration ###
clone clone_ping \
ping

### Fencing Topology ###
fencing_topology \
lbv1.beta.com: Stonith1-1 Stonith1-2 Stonith1-3 \
lbv2.beta.com: Stonith2-1 Stonith2-2 Stonith2-3

### Primitive Configuration ###
primitive vip_208 ocf:heartbeat:IPaddr2 \
params \
ip="192.168.17.208" \
nic="eth0" \
cidr_netmask="24" \
op start interval="0s" timeout="90s" on-fail="restart" \
op monitor interval="5s" timeout="60s" on-fail="restart" \
op stop interval="0s" timeout="100s" on-fail="fence"

primitive varnishd lsb:varnish \
op start interval="0s" timeout="90s" on-fail="restart" \
op monitor interval="10s" timeout="60s" on-fail="restart" \
op stop interval="0s" timeout="100s" on-fail="fence"

primitive ping ocf:pacemaker:ping \
params \
name="default_ping_set" \
host_list="192.168.17.254" \
multiplier="100" \
dampen="1" \
op start interval="0s" timeout="90s" on-fail="restart" \
op monitor interval="10s" timeout="60s" on-fail="restart" \
op stop interval="0s" timeout="100s" on-fail="fence"


primitive Stonith1-2 stonith:external/xen0 \
params \
pcmk_reboot_timeout="60s" \
hostlist="lbv1.beta.com:/etc/xen/lbv1.cfg" \
dom0="xen0.beta.com" \
op start interval="0s" timeout="60s" on-fail="restart" \
op monitor interval="3600s" timeout="60s" on-fail="restart" \
op stop interval="0s" timeout="60s" on-fail="ignore"

primitive Stonith1-3 stonith:meatware \
params \
pcmk_reboot_timeout="600s" \
hostlist="lbv1.beta.com" \
op start interval="0s" timeout="60s" \
op monitor interval="3600s" timeout="60s" \
op stop interval="0s" timeout="60s"

primitive Stonith2-1 stonith:external/stonith-helper \
params \
pcmk_reboot_retries="1" \
pcmk_reboot_timeout="40s" \
hostlist="lbv2.beta.com" \
dead_check_target="192.168.17.133 10.0.17.133" \
standby_wait_time="10" \
standby_check_command="/usr/local/sbin/crm_resource -r varnishd -W
| grep -q `hostname`" \
run_online_check="yes" \
op start interval="0s" timeout="60s" on-fail="restart" \
op stop interval="0s" timeout="60s" on-fail="ignore"

primitive Stonith2-2 stonith:external/xen0 \
params \
pcmk_reboot_timeout="60s" \
hostlist="lbv2.beta.com:/etc/xen/lbv2.cfg" \
dom0="xen0.beta.com" \
op start interval="0s" timeout="60s" on-fail="restart" \
op monitor interval="3600s" timeout="60s" on-fail="restart" \
op stop interval="0s" timeout="60s" on-fail="ignore"

primitive Stonith2-3 stonith:meatware \
params \
pcmk_reboot_timeout="600s" \
hostlist="lbv2.beta.com" \
op start interval="0s" timeout="60s" \
op monitor interval="3600s" timeout="60s" \
op stop interval="0s" timeout="60s"

### Resource Location ###
location HA_location-1 HAvarnish \
rule 200: #uname eq lbv1.beta.com \
rule 100: #uname eq lbv2.beta.com

location HA_location-2 HAvarnish \
rule -INFINITY: not_defined default_ping_set or default_ping_set lt 100

location HA_location-3 grpStonith1 \
rule -INFINITY: #uname eq lbv1.beta.com

location HA_location-4 grpStonith2 \
rule -INFINITY: #uname eq lbv2.beta.com

宜しくお願いします。

以上


2015年3月20日 17:16 <renayama19661014@ybb.ne.jp>:

> 福田さん
>
>
> お疲れ様です。山内です。
>
>
> >こちらの環境で、PM1.1.12のbuild:e32080bからbuild:561c4cfへ何度か戻したりしているうちにリブートを繰り返すようになってしまいました。
>
> この時ですが、戻したりする前に、
> 1)使っていたバージョンのソースディレクトリで、make uninstall
> 2)/var/lib/pacemaker/cib, /var/lib/pacemaker/pengineのディレクトリ中身を削除
> しておいた方がよいです。
>
> >そこで、再度debian7.8をクリーンインストールしてPM1.1.12 build:561c4cfをインストールしました。
> >あと、ご指摘頂いたパスを通したところ、こちらでもstonith-helperの起動までは確認できました。
>
>
> そうでしたか・・・・良かったですね。
> といっても、build:e32080bが動かないと問題ですが・・・・
>
> また、週末に時間が取れたら、こちらでもやってみます。
> 進展があれば、ご連絡いたします。
>
> 以上です。
>
>
>
>
--
ELF Systems
Masamichi Fukuda
mail to: *masamichi_fukuda@elf-systems.com <elfsystems.com@gmail.com>*
Re: stonithプラグインのパラメータについて [ In reply to ]
福田さん

お疲れ様です。山内です。

standby_wait_timeを入れて頂いて結構です。
たぶん、以前、例として開示したcrmは、あくまで例で、そのあたりは、考慮していなかっただけだと思います。

以上です。



----- Original Message -----
>From: Masamichi Fukuda - elf-systems <masamichi_fukuda@elf-systems.com>
>To: 山内英生 <renayama19661014@ybb.ne.jp>; "linux-ha-japan@lists.sourceforge.jp" <linux-ha-japan@lists.sourceforge.jp>
>Date: 2015/3/24, Tue 12:01
>Subject: stonithプラグインのパラメータについて
>
>
>山内さん
>
>こんにちは、福田です。
>その後、こちらではpacemaker1.1.12 build:561c4cf がとりあえず動いている状態です。
>
>済みませんが、stonithプラグインのパラメータについて質問させて下さい。
>
>stonith-helperのパラメータについてです。
>
>2013/8/3のOSC2013の資料には、standby_wait_time秒スリープして相撃ちを防止すると書いてあります。
>以前参考に頂いたコンフィグには、fencing_topologyを記述して、pcmk_reboot_retriesとpcmk_reboot_timeoutというパラメータが入って、standby_wait_timeは抜けていたかと思います。
>
>pacemaker1.1.12ではstandby_wait_timeの記述は必要無いのでしょうか。
>
>こちらでは、今次のようなコンフィグファイルを作っています。
>
>
>### Cluster Option ###
>property \
>    no-quorum-policy="ignore" \
>    stonith-enabled="true" \
>    startup-fencing="false" \
>    stonith-timeout="710s" \
>    crmd-transition-delay="2s"
>
>### Resource Default ###
>rsc_defaults \
>    resource-stickiness="INFINITY" \
>    migration-threshold="1"
>
>### Group Configuration ###
>group HAvarnish \
>    vip_208 \
>    varnishd
>
>group grpStonith1 \
>    Stonith1-1 \
>    Stonith1-2 \
>    Stonith1-3
>
>group grpStonith2 \
>    Stonith2-1 \
>    Stonith2-2 \
>    Stonith2-3
>
>### Clone Configuration ###
>clone clone_ping \
>    ping
>
>### Fencing Topology ###
>fencing_topology \
>    lbv1.beta.com: Stonith1-1 Stonith1-2 Stonith1-3 \
>    lbv2.beta.com: Stonith2-1 Stonith2-2 Stonith2-3
>
>### Primitive Configuration ###
>primitive vip_208 ocf:heartbeat:IPaddr2 \
>    params \
>        ip="192.168.17.208" \
>        nic="eth0" \
>        cidr_netmask="24" \
>    op start interval="0s" timeout="90s" on-fail="restart" \
>    op monitor interval="5s" timeout="60s" on-fail="restart" \
>    op stop interval="0s" timeout="100s" on-fail="fence"
>
>primitive varnishd lsb:varnish \
>    op start interval="0s" timeout="90s" on-fail="restart" \
>    op monitor interval="10s" timeout="60s" on-fail="restart" \
>    op stop interval="0s" timeout="100s" on-fail="fence"
>
>primitive ping ocf:pacemaker:ping \
>    params \
>        name="default_ping_set" \
>        host_list="192.168.17.254" \
>        multiplier="100" \
>        dampen="1" \
>    op start interval="0s" timeout="90s" on-fail="restart" \
>    op monitor interval="10s" timeout="60s" on-fail="restart" \
>    op stop interval="0s" timeout="100s" on-fail="fence"
>
>
>primitive Stonith1-2 stonith:external/xen0 \
>    params \
>        pcmk_reboot_timeout="60s" \
>        hostlist="lbv1.beta.com:/etc/xen/lbv1.cfg" \
>        dom0="xen0.beta.com" \
>    op start interval="0s" timeout="60s" on-fail="restart" \
>    op monitor interval="3600s" timeout="60s" on-fail="restart" \
>    op stop interval="0s" timeout="60s" on-fail="ignore"
>
>primitive Stonith1-3 stonith:meatware \
>    params \
>        pcmk_reboot_timeout="600s" \
>        hostlist="lbv1.beta.com" \
>    op start interval="0s" timeout="60s" \
>    op monitor interval="3600s" timeout="60s" \
>    op stop interval="0s" timeout="60s"
>
>primitive Stonith2-1 stonith:external/stonith-helper \
>    params \
>        pcmk_reboot_retries="1" \
>        pcmk_reboot_timeout="40s" \
>        hostlist="lbv2.beta.com" \
>        dead_check_target="192.168.17.133 10.0.17.133" \
>        standby_wait_time="10" \
>        standby_check_command="/usr/local/sbin/crm_resource -r varnishd -W | grep -q `hostname`" \
>        run_online_check="yes" \
>    op start interval="0s" timeout="60s" on-fail="restart" \
>    op stop interval="0s" timeout="60s" on-fail="ignore"
>
>primitive Stonith2-2 stonith:external/xen0 \
>    params \
>        pcmk_reboot_timeout="60s" \
>        hostlist="lbv2.beta.com:/etc/xen/lbv2.cfg" \
>        dom0="xen0.beta.com" \
>    op start interval="0s" timeout="60s" on-fail="restart" \
>    op monitor interval="3600s" timeout="60s" on-fail="restart" \
>    op stop interval="0s" timeout="60s" on-fail="ignore"
>
>primitive Stonith2-3 stonith:meatware \
>    params \
>        pcmk_reboot_timeout="600s" \
>        hostlist="lbv2.beta.com" \
>    op start interval="0s" timeout="60s" \
>    op monitor interval="3600s" timeout="60s" \
>    op stop interval="0s" timeout="60s"
>
>### Resource Location ###
>location HA_location-1 HAvarnish \
>    rule 200: #uname eq lbv1.beta.com \
>    rule 100: #uname eq lbv2.beta.com
>
>location HA_location-2 HAvarnish \
>    rule -INFINITY: not_defined default_ping_set or default_ping_set lt 100
>
>location HA_location-3 grpStonith1 \
>    rule -INFINITY: #uname eq lbv1.beta.com
>
>location HA_location-4 grpStonith2 \
>    rule -INFINITY: #uname eq lbv2.beta.com
>
>宜しくお願いします。
>
>以上
>
>
>
>
>2015年3月20日 17:16 <renayama19661014@ybb.ne.jp>:
>
>福田さん
>>
>>
>>お疲れ様です。山内です。
>>
>>>こちらの環境で、PM1.1.12のbuild:e32080bからbuild:561c4cfへ何度か戻したりしているうちにリブートを繰り返すようになってしまいました。
>>
>>この時ですが、戻したりする前に、
>>1)使っていたバージョンのソースディレクトリで、make uninstall
>>2)/var/lib/pacemaker/cib, /var/lib/pacemaker/pengineのディレクトリ中身を削除
>>しておいた方がよいです。
>>
>>>そこで、再度debian7.8をクリーンインストールしてPM1.1.12 build:561c4cfをインストールしました。
>>>あと、ご指摘頂いたパスを通したところ、こちらでもstonith-helperの起動までは確認できました。
>>
>>
>>そうでしたか・・・・良かったですね。
>>といっても、build:e32080bが動かないと問題ですが・・・・
>>
>>また、週末に時間が取れたら、こちらでもやってみます。
>>進展があれば、ご連絡いたします。
>>
>>以上です。
>>
>>
>>
>>
>--
>
>ELF Systems
>Masamichi Fukuda
>mail to: masamichi_fukuda@elf-systems.com
>
>

_______________________________________________
Linux-ha-japan mailing list
Linux-ha-japan@lists.sourceforge.jp
http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
Re: stonithプラグインのパラメータについて [ In reply to ]
TO$B!'J!ED$5$s(B

$BCfJ?$H?=$7$^$9!#2#$+$i<:Ni$$$?$7$^$9!#(B

standby_wait_time$B$G$9$,!"5-=R$r>JN,$7$?>l9g$O%G%U%)%k%HCM$H$7$F(B
25$BIC$,@_Dj$5$l!"4pK\E*$K$O%G%U%)%k%HCM$N$^$^;HMQ$7$FD:$/$3$H$r(B
$B?d>)$7$F$$$^$9!#(B

$B$b$72>$K!"J!ED$5$s$N4D6-$G8=MQ5!$H(B DC$B%N!<%I(B($B%/%i%9%?4IM}%N!<%I(B)
$B$,I,$:0lCW$9$k$h$&$J1?MQ$r$5$l$F$$$k>l9g$O!"(Bstandby_wait_time
$B$K(B 10$BIC$r@_Dj$7%U%'%$%k%*!<%P;~4V$rC;=L$5$;$F$bLdBj$,$J$$$H(B
$B;W$$$^$9$,!"$=$&$G$J$$>l9g$OAj7b$A$,5/$-$k2DG=@-$,$"$j$^$9!#(B

$B$3$l$O!"8=MQ5!$,(B DC$B%N!<%I$G$J$$>l9g!"%/%i%9%?4VDL?.$NES@d8e(B
DC$B%N!<%I$NLr3d$r0z$-7Q$$$G(B STONITH$B$r<B9T$9$k$^$G$N4V$K?tIC(B
$B$+$+$k>l9g$,$"$k$?$a$G!">u67$K$h$C$F$OM=Hw5!$,@h$K(B STONITH$B$r(B
$B<B9T$7$?$j!"Aj7b$A$r@8$8$^$9!#(B

standby_wait_time$B$r%G%U%)%k%HCM$h$jC;$/@_Dj$9$k>l9g$O!"(B
$B>e5-$r9MN8$7$?$&$($G@Z$jBX$(;n83$r<B;\$7!"Aj7b$A$dM=Hw5!$,(B
$B@8$-;D$k$3$H$,$J$$$3$H$r3NG'$7$F$+$i!"@_Dj$r:NMQ$9$k$h$&$K(B
$B$7$F2<$5$$!#(B

$B0J>e$G$9!#(B

On 2015/03/24 12:21, renayama19661014@ybb.ne.jp wrote:
> $BJ!ED$5$s(B
>
> $B$*Hh$lMM$G$9!#;3Fb$G$9!#(B
>
> standby_wait_time$B$rF~$l$FD:$$$F7k9=$G$9!#(B
> $B$?$V$s!"0JA0!"Nc$H$7$F3+<($7$?(Bcrm$B$O!"$"$/$^$GNc$G!"$=$N$"$?$j$O!"9MN8$7$F$$$J$+$C$?$@$1$@$H;W$$$^$9!#(B
>
> $B0J>e$G$9!#(B
>
>
>
> ----- Original Message -----
>> From: Masamichi Fukuda - elf-systems <masamichi_fukuda@elf-systems.com>
>> To: $B;3Fb1Q@8(B <renayama19661014@ybb.ne.jp>; "linux-ha-japan@lists.sourceforge.jp" <linux-ha-japan@lists.sourceforge.jp>
>> Date: 2015/3/24, Tue 12:01
>> Subject: stonith$B%W%i%0%$%s$N%Q%i%a!<%?$K$D$$$F(B
>>
>>
>> $B;3Fb$5$s(B
>>
>> $B$3$s$K$A$O!"J!ED$G$9!#(B
>> $B$=$N8e!"$3$A$i$G$O(Bpacemaker1.1.12 build:561c4cf $B$,$H$j$"$($:F0$$$F$$$k>uBV$G$9!#(B
>>
>> $B:Q$_$^$;$s$,!"(Bstonith$B%W%i%0%$%s$N%Q%i%a!<%?$K$D$$$F<ALd$5$;$F2<$5$$!#(B
>>
>> stonith-helper$B$N%Q%i%a!<%?$K$D$$$F$G$9!#(B
>>
>> 2013/8/3$B$N(BOSC2013$B$N;qNA$K$O!"(Bstandby_wait_time$BIC%9%j!<%W$7$FAj7b$A$rKI;_$9$k$H=q$$$F$"$j$^$9!#(B
>> $B0JA0;29M$KD:$$$?%3%s%U%#%0$K$O!"(Bfencing_topology$B$r5-=R$7$F!"(Bpcmk_reboot_retries$B$H(Bpcmk_reboot_timeout$B$H$$$&%Q%i%a!<%?$,F~$C$F!"(Bstandby_wait_time$B$OH4$1$F$$$?$+$H;W$$$^$9!#(B
>>
>> pacemaker1.1.12$B$G$O(Bstandby_wait_time$B$N5-=R$OI,MWL5$$$N$G$7$g$&$+!#(B
>>
>> $B$3$A$i$G$O!":#<!$N$h$&$J%3%s%U%#%0%U%!%$%k$r:n$C$F$$$^$9!#(B
>>
>>
>> ### Cluster Option ###
>> property \
>> no-quorum-policy="ignore" \
>> stonith-enabled="true" \
>> startup-fencing="false" \
>> stonith-timeout="710s" \
>> crmd-transition-delay="2s"
>>
>> ### Resource Default ###
>> rsc_defaults \
>> resource-stickiness="INFINITY" \
>> migration-threshold="1"
>>
>> ### Group Configuration ###
>> group HAvarnish \
>> vip_208 \
>> varnishd
>>
>> group grpStonith1 \
>> Stonith1-1 \
>> Stonith1-2 \
>> Stonith1-3
>>
>> group grpStonith2 \
>> Stonith2-1 \
>> Stonith2-2 \
>> Stonith2-3
>>
>> ### Clone Configuration ###
>> clone clone_ping \
>> ping
>>
>> ### Fencing Topology ###
>> fencing_topology \
>> lbv1.beta.com: Stonith1-1 Stonith1-2 Stonith1-3 \
>> lbv2.beta.com: Stonith2-1 Stonith2-2 Stonith2-3
>>
>> ### Primitive Configuration ###
>> primitive vip_208 ocf:heartbeat:IPaddr2 \
>> params \
>> ip="192.168.17.208" \
>> nic="eth0" \
>> cidr_netmask="24" \
>> op start interval="0s" timeout="90s" on-fail="restart" \
>> op monitor interval="5s" timeout="60s" on-fail="restart" \
>> op stop interval="0s" timeout="100s" on-fail="fence"
>>
>> primitive varnishd lsb:varnish \
>> op start interval="0s" timeout="90s" on-fail="restart" \
>> op monitor interval="10s" timeout="60s" on-fail="restart" \
>> op stop interval="0s" timeout="100s" on-fail="fence"
>>
>> primitive ping ocf:pacemaker:ping \
>> params \
>> name="default_ping_set" \
>> host_list="192.168.17.254" \
>> multiplier="100" \
>> dampen="1" \
>> op start interval="0s" timeout="90s" on-fail="restart" \
>> op monitor interval="10s" timeout="60s" on-fail="restart" \
>> op stop interval="0s" timeout="100s" on-fail="fence"
>>
>>
>> primitive Stonith1-2 stonith:external/xen0 \
>> params \
>> pcmk_reboot_timeout="60s" \
>> hostlist="lbv1.beta.com:/etc/xen/lbv1.cfg" \
>> dom0="xen0.beta.com" \
>> op start interval="0s" timeout="60s" on-fail="restart" \
>> op monitor interval="3600s" timeout="60s" on-fail="restart" \
>> op stop interval="0s" timeout="60s" on-fail="ignore"
>>
>> primitive Stonith1-3 stonith:meatware \
>> params \
>> pcmk_reboot_timeout="600s" \
>> hostlist="lbv1.beta.com" \
>> op start interval="0s" timeout="60s" \
>> op monitor interval="3600s" timeout="60s" \
>> op stop interval="0s" timeout="60s"
>>
>> primitive Stonith2-1 stonith:external/stonith-helper \
>> params \
>> pcmk_reboot_retries="1" \
>> pcmk_reboot_timeout="40s" \
>> hostlist="lbv2.beta.com" \
>> dead_check_target="192.168.17.133 10.0.17.133" \
>> standby_wait_time="10" \
>> standby_check_command="/usr/local/sbin/crm_resource -r varnishd -W | grep -q `hostname`" \
>> run_online_check="yes" \
>> op start interval="0s" timeout="60s" on-fail="restart" \
>> op stop interval="0s" timeout="60s" on-fail="ignore"
>>
>> primitive Stonith2-2 stonith:external/xen0 \
>> params \
>> pcmk_reboot_timeout="60s" \
>> hostlist="lbv2.beta.com:/etc/xen/lbv2.cfg" \
>> dom0="xen0.beta.com" \
>> op start interval="0s" timeout="60s" on-fail="restart" \
>> op monitor interval="3600s" timeout="60s" on-fail="restart" \
>> op stop interval="0s" timeout="60s" on-fail="ignore"
>>
>> primitive Stonith2-3 stonith:meatware \
>> params \
>> pcmk_reboot_timeout="600s" \
>> hostlist="lbv2.beta.com" \
>> op start interval="0s" timeout="60s" \
>> op monitor interval="3600s" timeout="60s" \
>> op stop interval="0s" timeout="60s"
>>
>> ### Resource Location ###
>> location HA_location-1 HAvarnish \
>> rule 200: #uname eq lbv1.beta.com \
>> rule 100: #uname eq lbv2.beta.com
>>
>> location HA_location-2 HAvarnish \
>> rule -INFINITY: not_defined default_ping_set or default_ping_set lt 100
>>
>> location HA_location-3 grpStonith1 \
>> rule -INFINITY: #uname eq lbv1.beta.com
>>
>> location HA_location-4 grpStonith2 \
>> rule -INFINITY: #uname eq lbv2.beta.com
>>
>> $B59$7$/$*4j$$$7$^$9!#(B
>>
>> $B0J>e(B
>>
>>
>>
>>
>> 2015$BG/(B3$B7n(B20$BF|(B 17:16 <renayama19661014@ybb.ne.jp>:
>>
>> $BJ!ED$5$s(B
>>>
>>>
>>> $B$*Hh$lMM$G$9!#;3Fb$G$9!#(B
>>>
>>>> $B$3$A$i$N4D6-$G!"(BPM1.1.12$B$N(Bbuild:e32080b$B$+$i(Bbuild:561c4cf$B$X2?EY$+La$7$?$j$7$F$$$k$&$A$K%j%V!<%H$r7+$jJV$9$h$&$K$J$C$F$7$^$$$^$7$?!#(B
>>>
>>> $B$3$N;~$G$9$,!"La$7$?$j$9$kA0$K!"(B
>>> $B#1!K;H$C$F$$$?%P!<%8%g%s$N%=!<%9%G%#%l%/%H%j$G!"(Bmake uninstall
>>> $B#2!K(B/var/lib/pacemaker/cib, /var/lib/pacemaker/pengine$B$N%G%#%l%/%H%jCf?H$r:o=|(B
>>> $B$7$F$*$$$?J}$,$h$$$G$9!#(B
>>>
>>>> $B$=$3$G!":FEY(Bdebian7.8$B$r%/%j!<%s%$%s%9%H!<%k$7$F(BPM1.1.12 build:561c4cf$B$r%$%s%9%H!<%k$7$^$7$?!#(B
>>>> $B$"$H!"$4;XE&D:$$$?%Q%9$rDL$7$?$H$3$m!"$3$A$i$G$b(Bstonith-helper$B$N5/F0$^$G$O3NG'$G$-$^$7$?!#(B
>>>
>>>
>>> $B$=$&$G$7$?$+!&!&!&!&NI$+$C$?$G$9$M!#(B
>>> $B$H$$$C$F$b!"(Bbuild:e32080b$B$,F0$+$J$$$HLdBj$G$9$,!&!&!&!&(B
>>>
>>> $B$^$?!"=5Kv$K;~4V$,<h$l$?$i!"$3$A$i$G$b$d$C$F$_$^$9!#(B
>>> $B?JE8$,$"$l$P!"$4O"Mm$$$?$7$^$9!#(B
>>>
>>> $B0J>e$G$9!#(B
>>>
>>>
>>>
>>>
>> --
>>
>> ELF Systems
>> Masamichi Fukuda
>> mail to: masamichi_fukuda@elf-systems.com
>>
>>
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux-ha-japan@lists.sourceforge.jp
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>
>
>


--
NTT $B%*!<%W%s%=!<%9%=%U%H%&%'%"%;%s%?(B
$BCfJ?(B $BOBM'(B
TEL: 03-5860-5135 FAX: 03-5463-6490
Mail: nakahira_kazutomo_b1@lab.ntt.co.jp

_______________________________________________
Linux-ha-japan mailing list
Linux-ha-japan@lists.sourceforge.jp
http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
Re: stonithプラグインのパラメータについて [ In reply to ]
中平さん、山内さん

こんにちは、福田です。

standby_wait_timeについての情報をありがとうございます。

>もし仮に、福田さんの環境で現用機と DCノード(クラスタ管理ノード)
>が必ず一致するような運用をされている場合は、standby_
>
> wait_time
> に 10秒を設定しフェイルオーバ時間を短縮させても問題がないと
> 思いますが、そうでない場合は相撃ちが起きる可能性があります。

なるほど、そういった可能性があるのですね。
今のところ、現用機とDCノードは一致させるようにしたいとは思っています。

>standby_wait_
>
> timeをデフォルト値より短く設定する場合は、
> 上記を考慮したうえで切り替え試験を実施し、相撃ちや予備機が
> 生き残ることがないことを確認してから、設定を採用するように
> して下さい。

わかりました。
切替試験の際には、上記のことを念頭にやってみます。

宜しくお願いします。

以上


2015年3月24日 13:52 NAKAHIRA Kazutomo <nakahira_kazutomo_b1@lab.ntt.co.jp>:

> TO:福田さん
>
> 中平と申します。横から失礼いたします。
>
> standby_wait_timeですが、記述を省略した場合はデフォルト値として
> 25秒が設定され、基本的にはデフォルト値のまま使用して頂くことを
> 推奨しています。
>
> もし仮に、福田さんの環境で現用機と DCノード(クラスタ管理ノード)
> が必ず一致するような運用をされている場合は、standby_wait_time
> に 10秒を設定しフェイルオーバ時間を短縮させても問題がないと
> 思いますが、そうでない場合は相撃ちが起きる可能性があります。
>
> これは、現用機が DCノードでない場合、クラスタ間通信の途絶後
> DCノードの役割を引き継いで STONITHを実行するまでの間に数秒
> かかる場合があるためで、状況によっては予備機が先に STONITHを
> 実行したり、相撃ちを生じます。
>
> standby_wait_timeをデフォルト値より短く設定する場合は、
> 上記を考慮したうえで切り替え試験を実施し、相撃ちや予備機が
> 生き残ることがないことを確認してから、設定を採用するように
> して下さい。
>
> 以上です。
>
> On 2015/03/24 12:21, renayama19661014@ybb.ne.jp wrote:
> > 福田さん
> >
> > お疲れ様です。山内です。
> >
> > standby_wait_timeを入れて頂いて結構です。
> > たぶん、以前、例として開示したcrmは、あくまで例で、そのあたりは、考慮していなかっただけだと思います。
> >
> > 以上です。
> >
> >
> >
> > ----- Original Message -----
> >> From: Masamichi Fukuda - elf-systems <masamichi_fukuda@elf-systems.com>
> >> To: 山内英生 <renayama19661014@ybb.ne.jp>; "
> linux-ha-japan@lists.sourceforge.jp" <linux-ha-japan@lists.sourceforge.jp>
> >> Date: 2015/3/24, Tue 12:01
> >> Subject: stonithプラグインのパラメータについて
> >>
> >>
> >> 山内さん
> >>
> >> こんにちは、福田です。
> >> その後、こちらではpacemaker1.1.12 build:561c4cf がとりあえず動いている状態です。
> >>
> >> 済みませんが、stonithプラグインのパラメータについて質問させて下さい。
> >>
> >> stonith-helperのパラメータについてです。
> >>
> >> 2013/8/3のOSC2013の資料には、standby_wait_time秒スリープして相撃ちを防止すると書いてあります。
> >>
> 以前参考に頂いたコンフィグには、fencing_topologyを記述して、pcmk_reboot_retriesとpcmk_reboot_timeoutというパラメータが入って、standby_wait_timeは抜けていたかと思います。
> >>
> >> pacemaker1.1.12ではstandby_wait_timeの記述は必要無いのでしょうか。
> >>
> >> こちらでは、今次のようなコンフィグファイルを作っています。
> >>
> >>
> >> ### Cluster Option ###
> >> property \
> >> no-quorum-policy="ignore" \
> >> stonith-enabled="true" \
> >> startup-fencing="false" \
> >> stonith-timeout="710s" \
> >> crmd-transition-delay="2s"
> >>
> >> ### Resource Default ###
> >> rsc_defaults \
> >> resource-stickiness="INFINITY" \
> >> migration-threshold="1"
> >>
> >> ### Group Configuration ###
> >> group HAvarnish \
> >> vip_208 \
> >> varnishd
> >>
> >> group grpStonith1 \
> >> Stonith1-1 \
> >> Stonith1-2 \
> >> Stonith1-3
> >>
> >> group grpStonith2 \
> >> Stonith2-1 \
> >> Stonith2-2 \
> >> Stonith2-3
> >>
> >> ### Clone Configuration ###
> >> clone clone_ping \
> >> ping
> >>
> >> ### Fencing Topology ###
> >> fencing_topology \
> >> lbv1.beta.com: Stonith1-1 Stonith1-2 Stonith1-3 \
> >> lbv2.beta.com: Stonith2-1 Stonith2-2 Stonith2-3
> >>
> >> ### Primitive Configuration ###
> >> primitive vip_208 ocf:heartbeat:IPaddr2 \
> >> params \
> >> ip="192.168.17.208" \
> >> nic="eth0" \
> >> cidr_netmask="24" \
> >> op start interval="0s" timeout="90s" on-fail="restart" \
> >> op monitor interval="5s" timeout="60s" on-fail="restart" \
> >> op stop interval="0s" timeout="100s" on-fail="fence"
> >>
> >> primitive varnishd lsb:varnish \
> >> op start interval="0s" timeout="90s" on-fail="restart" \
> >> op monitor interval="10s" timeout="60s" on-fail="restart" \
> >> op stop interval="0s" timeout="100s" on-fail="fence"
> >>
> >> primitive ping ocf:pacemaker:ping \
> >> params \
> >> name="default_ping_set" \
> >> host_list="192.168.17.254" \
> >> multiplier="100" \
> >> dampen="1" \
> >> op start interval="0s" timeout="90s" on-fail="restart" \
> >> op monitor interval="10s" timeout="60s" on-fail="restart" \
> >> op stop interval="0s" timeout="100s" on-fail="fence"
> >>
> >>
> >> primitive Stonith1-2 stonith:external/xen0 \
> >> params \
> >> pcmk_reboot_timeout="60s" \
> >> hostlist="lbv1.beta.com:/etc/xen/lbv1.cfg" \
> >> dom0="xen0.beta.com" \
> >> op start interval="0s" timeout="60s" on-fail="restart" \
> >> op monitor interval="3600s" timeout="60s" on-fail="restart" \
> >> op stop interval="0s" timeout="60s" on-fail="ignore"
> >>
> >> primitive Stonith1-3 stonith:meatware \
> >> params \
> >> pcmk_reboot_timeout="600s" \
> >> hostlist="lbv1.beta.com" \
> >> op start interval="0s" timeout="60s" \
> >> op monitor interval="3600s" timeout="60s" \
> >> op stop interval="0s" timeout="60s"
> >>
> >> primitive Stonith2-1 stonith:external/stonith-helper \
> >> params \
> >> pcmk_reboot_retries="1" \
> >> pcmk_reboot_timeout="40s" \
> >> hostlist="lbv2.beta.com" \
> >> dead_check_target="192.168.17.133 10.0.17.133" \
> >> standby_wait_time="10" \
> >> standby_check_command="/usr/local/sbin/crm_resource -r
> varnishd -W | grep -q `hostname`" \
> >> run_online_check="yes" \
> >> op start interval="0s" timeout="60s" on-fail="restart" \
> >> op stop interval="0s" timeout="60s" on-fail="ignore"
> >>
> >> primitive Stonith2-2 stonith:external/xen0 \
> >> params \
> >> pcmk_reboot_timeout="60s" \
> >> hostlist="lbv2.beta.com:/etc/xen/lbv2.cfg" \
> >> dom0="xen0.beta.com" \
> >> op start interval="0s" timeout="60s" on-fail="restart" \
> >> op monitor interval="3600s" timeout="60s" on-fail="restart" \
> >> op stop interval="0s" timeout="60s" on-fail="ignore"
> >>
> >> primitive Stonith2-3 stonith:meatware \
> >> params \
> >> pcmk_reboot_timeout="600s" \
> >> hostlist="lbv2.beta.com" \
> >> op start interval="0s" timeout="60s" \
> >> op monitor interval="3600s" timeout="60s" \
> >> op stop interval="0s" timeout="60s"
> >>
> >> ### Resource Location ###
> >> location HA_location-1 HAvarnish \
> >> rule 200: #uname eq lbv1.beta.com \
> >> rule 100: #uname eq lbv2.beta.com
> >>
> >> location HA_location-2 HAvarnish \
> >> rule -INFINITY: not_defined default_ping_set or default_ping_set
> lt 100
> >>
> >> location HA_location-3 grpStonith1 \
> >> rule -INFINITY: #uname eq lbv1.beta.com
> >>
> >> location HA_location-4 grpStonith2 \
> >> rule -INFINITY: #uname eq lbv2.beta.com
> >>
> >> 宜しくお願いします。
> >>
> >> 以上
> >>
> >>
> >>
> >>
> >> 2015年3月20日 17:16 <renayama19661014@ybb.ne.jp>:
> >>
> >> 福田さん
> >>>
> >>>
> >>> お疲れ様です。山内です。
> >>>
> >>>>
> こちらの環境で、PM1.1.12のbuild:e32080bからbuild:561c4cfへ何度か戻したりしているうちにリブートを繰り返すようになってしまいました。
> >>>
> >>> この時ですが、戻したりする前に、
> >>> 1)使っていたバージョンのソースディレクトリで、make uninstall
> >>> 2)/var/lib/pacemaker/cib, /var/lib/pacemaker/pengineのディレクトリ中身を削除
> >>> しておいた方がよいです。
> >>>
> >>>> そこで、再度debian7.8をクリーンインストールしてPM1.1.12 build:561c4cfをインストールしました。
> >>>> あと、ご指摘頂いたパスを通したところ、こちらでもstonith-helperの起動までは確認できました。
> >>>
> >>>
> >>> そうでしたか・・・・良かったですね。
> >>> といっても、build:e32080bが動かないと問題ですが・・・・
> >>>
> >>> また、週末に時間が取れたら、こちらでもやってみます。
> >>> 進展があれば、ご連絡いたします。
> >>>
> >>> 以上です。
> >>>
> >>>
> >>>
> >>>
> >> --
> >>
> >> ELF Systems
> >> Masamichi Fukuda
> >> mail to: masamichi_fukuda@elf-systems.com
> >>
> >>
> >
> > _______________________________________________
> > Linux-ha-japan mailing list
> > Linux-ha-japan@lists.sourceforge.jp
> > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> >
> >
> >
>
>
> --
> NTT オープンソースソフトウェアセンタ
> 中平 和友
> TEL: 03-5860-5135 FAX: 03-5463-6490
> Mail: nakahira_kazutomo_b1@lab.ntt.co.jp
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux-ha-japan@lists.sourceforge.jp
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>
>


--
ELF Systems
Masamichi Fukuda
mail to: *masamichi_fukuda@elf-systems.com <elfsystems.com@gmail.com>*