トークン分割では、単純に、なでしこのソースを解析する仕組みをそのまま使っているようなので、識別子(変数名や関数名)に使えない文字で、無視されない文字(平仮名は命令の解析上無視される)で、演算子でもない文字はエラーになると思います。
※おおざっぱには、個別の意味を割り当てられてなくて、変数名にも使えない、記号です。半角の記号は大体なにかしらの意味が割り当てられているので、主には全角の記号になります。
「なでしこと同じ」という点はメリットになりそうなので、③がよさそうなのです。(普段、見かけない文字やどうやって表示するのかまようような文字が大半です)
それとは別として、かな漢字とそれの濁点付きでの、「同じ」「繰り返し」を表す文字は、識別子として使えたほうが良いのでしょうか・・・?