<div dir="auto">Thank you both for the great work!<div dir="auto">I will give it a try, too.</div><div dir="auto"><br></div><div dir="auto">George</div></div><br><div class="gmail_quote"><div dir="ltr">On Fri, Jul 6, 2018, 9:29 AM Toke Høiland-Jørgensen <<a href="mailto:toke@toke.dk">toke@toke.dk</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Pete Heist <<a href="mailto:pete@heistp.net" target="_blank" rel="noreferrer">pete@heistp.net</a>> writes:<br>
<br>
> I don’t know if we want to call this an issue, but...<br>
><br>
> I’m seeing a lockup with cake (and also sfq, but not either pfifo or<br>
> fq_codel), when run over veth devices. Two network namespaces are<br>
> created, one for client and one for server, each with one veth device.<br>
> Netem is added as the root qdisc with a delay of 1ms, and a leaf qdisc<br>
> may be added. Lockups occur on my box when the leaf qdisc is either<br>
> cake or sfq, and I'm running flent’s tcp_ndown test with >= 4 download<br>
> streams. Note that I happen to be running on a quad-core.<br>
><br>
> - If no leaf qdisc is added below netem, no lockup occurs.<br>
> - If either pfifo or fq_codel is added below netem, no lockup occurs.<br>
> - If either cake or sfq is the leaf, the lockup occurs.<br>
><br>
> The symptoms (lockup with >= 4 streams on a quad-core box), and the<br>
> fact that it occurs with both cake and sfq, make me think that it may<br>
> simply have to do with the code not being re-entrant, which may be the<br>
> case for veth, and this is just by design? maybe something that we<br>
> should consider fixing but wouldn’t be a show-stopper? But that should<br>
> be confirmed.<br>
><br>
> I’ll keep investigating, but am sharing the scripts I’m running<br>
> meanwhile in case anyone else wants to look. See README.txt in the<br>
> attached...<br>
<br>
Thanks for investigating! I'll take a look later. The fact that it<br>
happens with sfq as well means it's probably not cake-specific, though,<br>
so I don't think we should hold off on the upstream submission until<br>
we've figured it out. Using leaf qdiscs with netem has been dodgy for a<br>
while IIRC...<br>
<br>
-Toke<br>
_______________________________________________<br>
Cake mailing list<br>
<a href="mailto:Cake@lists.bufferbloat.net" target="_blank" rel="noreferrer">Cake@lists.bufferbloat.net</a><br>
<a href="https://lists.bufferbloat.net/listinfo/cake" rel="noreferrer noreferrer" target="_blank">https://lists.bufferbloat.net/listinfo/cake</a><br>
</blockquote></div>