OSDN Git Service

am 48e19b03: Implement the fallthrough rule to support split tunnel VPNs.
[android-x86/system-netd.git] / server / RouteController.cpp
1 /*
2  * Copyright (C) 2014 The Android Open Source Project
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  *      http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 #include "RouteController.h"
18
19 #include "Fwmark.h"
20 #include "UidRanges.h"
21
22 #define LOG_TAG "Netd"
23 #include "log/log.h"
24 #include "logwrap/logwrap.h"
25 #include "resolv_netid.h"
26
27 #include <arpa/inet.h>
28 #include <fcntl.h>
29 #include <linux/fib_rules.h>
30 #include <map>
31 #include <net/if.h>
32 #include <sys/stat.h>
33
34 namespace {
35
36 // BEGIN CONSTANTS --------------------------------------------------------------------------------
37
38 const uint32_t RULE_PRIORITY_VPN_OVERRIDE_SYSTEM = 10000;
39 const uint32_t RULE_PRIORITY_VPN_OUTPUT_TO_LOCAL = 11000;
40 const uint32_t RULE_PRIORITY_SECURE_VPN          = 12000;
41 const uint32_t RULE_PRIORITY_EXPLICIT_NETWORK    = 13000;
42 const uint32_t RULE_PRIORITY_OUTPUT_INTERFACE    = 14000;
43 const uint32_t RULE_PRIORITY_LEGACY_SYSTEM       = 15000;
44 const uint32_t RULE_PRIORITY_LEGACY_NETWORK      = 16000;
45 const uint32_t RULE_PRIORITY_LOCAL_NETWORK       = 17000;
46 const uint32_t RULE_PRIORITY_TETHERING           = 18000;
47 const uint32_t RULE_PRIORITY_IMPLICIT_NETWORK    = 19000;
48 const uint32_t RULE_PRIORITY_BYPASSABLE_VPN      = 20000;
49 const uint32_t RULE_PRIORITY_VPN_FALLTHROUGH     = 21000;
50 const uint32_t RULE_PRIORITY_DEFAULT_NETWORK     = 22000;
51 const uint32_t RULE_PRIORITY_DIRECTLY_CONNECTED  = 23000;
52 const uint32_t RULE_PRIORITY_UNREACHABLE         = 24000;
53
54 const uint32_t ROUTE_TABLE_LOCAL_NETWORK  = 97;
55 const uint32_t ROUTE_TABLE_LEGACY_NETWORK = 98;
56 const uint32_t ROUTE_TABLE_LEGACY_SYSTEM  = 99;
57
58 const char* const ROUTE_TABLE_NAME_LOCAL_NETWORK  = "local_network";
59 const char* const ROUTE_TABLE_NAME_LEGACY_NETWORK = "legacy_network";
60 const char* const ROUTE_TABLE_NAME_LEGACY_SYSTEM  = "legacy_system";
61
62 const char* const ROUTE_TABLE_NAME_LOCAL = "local";
63 const char* const ROUTE_TABLE_NAME_MAIN  = "main";
64
65 // TODO: These values aren't defined by the Linux kernel, because our UID routing changes are not
66 // upstream (yet?), so we can't just pick them up from kernel headers. When (if?) the changes make
67 // it upstream, we'll remove this and rely on the kernel header values. For now, add a static assert
68 // that will warn us if upstream has given these values some other meaning.
69 const uint16_t FRA_UID_START = 18;
70 const uint16_t FRA_UID_END   = 19;
71 static_assert(FRA_UID_START > FRA_MAX,
72              "Android-specific FRA_UID_{START,END} values also assigned in Linux uapi. "
73              "Check that these values match what the kernel does and then update this assertion.");
74
75 const uint16_t NETLINK_REQUEST_FLAGS = NLM_F_REQUEST | NLM_F_ACK;
76 const uint16_t NETLINK_CREATE_REQUEST_FLAGS = NETLINK_REQUEST_FLAGS | NLM_F_CREATE | NLM_F_EXCL;
77
78 const sockaddr_nl NETLINK_ADDRESS = {AF_NETLINK, 0, 0, 0};
79
80 const uint8_t AF_FAMILIES[] = {AF_INET, AF_INET6};
81
82 const char* const IP_VERSIONS[] = {"-4", "-6"};
83
84 const uid_t UID_ROOT = 0;
85 const char* const IIF_NONE = NULL;
86 const char* const OIF_NONE = NULL;
87 const bool ACTION_ADD = true;
88 const bool ACTION_DEL = false;
89 const bool MODIFY_NON_UID_BASED_RULES = true;
90
91 const char* const RT_TABLES_PATH = "/data/misc/net/rt_tables";
92 const int RT_TABLES_FLAGS = O_CREAT | O_TRUNC | O_WRONLY | O_NOFOLLOW | O_CLOEXEC;
93 const mode_t RT_TABLES_MODE = S_IRUSR | S_IWUSR | S_IRGRP | S_IROTH;  // mode 0644, rw-r--r--
94
95 // Avoids "non-constant-expression cannot be narrowed from type 'unsigned int' to 'unsigned short'"
96 // warnings when using RTA_LENGTH(x) inside static initializers (even when x is already uint16_t).
97 constexpr uint16_t U16_RTA_LENGTH(uint16_t x) {
98     return RTA_LENGTH(x);
99 }
100
101 // These are practically const, but can't be declared so, because they are used to initialize
102 // non-const pointers ("void* iov_base") in iovec arrays.
103 rtattr FRATTR_PRIORITY  = { U16_RTA_LENGTH(sizeof(uint32_t)), FRA_PRIORITY };
104 rtattr FRATTR_TABLE     = { U16_RTA_LENGTH(sizeof(uint32_t)), FRA_TABLE };
105 rtattr FRATTR_FWMARK    = { U16_RTA_LENGTH(sizeof(uint32_t)), FRA_FWMARK };
106 rtattr FRATTR_FWMASK    = { U16_RTA_LENGTH(sizeof(uint32_t)), FRA_FWMASK };
107 rtattr FRATTR_UID_START = { U16_RTA_LENGTH(sizeof(uid_t)),    FRA_UID_START };
108 rtattr FRATTR_UID_END   = { U16_RTA_LENGTH(sizeof(uid_t)),    FRA_UID_END };
109
110 rtattr RTATTR_TABLE     = { U16_RTA_LENGTH(sizeof(uint32_t)), RTA_TABLE };
111 rtattr RTATTR_OIF       = { U16_RTA_LENGTH(sizeof(uint32_t)), RTA_OIF };
112
113 uint8_t PADDING_BUFFER[RTA_ALIGNTO] = {0, 0, 0, 0};
114
115 // END CONSTANTS ----------------------------------------------------------------------------------
116
117 // No locks needed because RouteController is accessed only from one thread (in CommandListener).
118 std::map<std::string, uint32_t> interfaceToTable;
119
120 uint32_t getRouteTableForInterface(const char* interface) {
121     uint32_t index = if_nametoindex(interface);
122     if (index) {
123         index += RouteController::ROUTE_TABLE_OFFSET_FROM_INDEX;
124         interfaceToTable[interface] = index;
125         return index;
126     }
127     // If the interface goes away if_nametoindex() will return 0 but we still need to know
128     // the index so we can remove the rules and routes.
129     auto iter = interfaceToTable.find(interface);
130     if (iter == interfaceToTable.end()) {
131         ALOGE("cannot find interface %s", interface);
132         return RT_TABLE_UNSPEC;
133     }
134     return iter->second;
135 }
136
137 void addTableName(uint32_t table, const std::string& name, std::string* contents) {
138     char tableString[UINT32_STRLEN];
139     snprintf(tableString, sizeof(tableString), "%u", table);
140     *contents += tableString;
141     *contents += " ";
142     *contents += name;
143     *contents += "\n";
144 }
145
146 // Doesn't return success/failure as the file is optional; it's okay if we fail to update it.
147 void updateTableNamesFile() {
148     std::string contents;
149
150     addTableName(RT_TABLE_LOCAL, ROUTE_TABLE_NAME_LOCAL, &contents);
151     addTableName(RT_TABLE_MAIN,  ROUTE_TABLE_NAME_MAIN,  &contents);
152
153     addTableName(ROUTE_TABLE_LOCAL_NETWORK,  ROUTE_TABLE_NAME_LOCAL_NETWORK,  &contents);
154     addTableName(ROUTE_TABLE_LEGACY_NETWORK, ROUTE_TABLE_NAME_LEGACY_NETWORK, &contents);
155     addTableName(ROUTE_TABLE_LEGACY_SYSTEM,  ROUTE_TABLE_NAME_LEGACY_SYSTEM,  &contents);
156
157     for (const auto& entry : interfaceToTable) {
158         addTableName(entry.second, entry.first, &contents);
159     }
160
161     int fd = open(RT_TABLES_PATH, RT_TABLES_FLAGS, RT_TABLES_MODE);
162     if (fd == -1) {
163         ALOGE("failed to create %s (%s)", RT_TABLES_PATH, strerror(errno));
164         return;
165     }
166     // File creation is affected by umask, so make sure the right mode bits are set.
167     if (fchmod(fd, RT_TABLES_MODE) == -1) {
168         ALOGE("failed to set mode 0%o on %s (%s)", RT_TABLES_MODE, RT_TABLES_PATH, strerror(errno));
169     }
170     ssize_t bytesWritten = write(fd, contents.data(), contents.size());
171     if (bytesWritten != static_cast<ssize_t>(contents.size())) {
172         ALOGE("failed to write to %s (%zd vs %zu bytes) (%s)", RT_TABLES_PATH, bytesWritten,
173               contents.size(), strerror(errno));
174     }
175     close(fd);
176 }
177
178 // Sends a netlink request and expects an ack.
179 // |iov| is an array of struct iovec that contains the netlink message payload.
180 // The netlink header is generated by this function based on |action| and |flags|.
181 // Returns -errno if there was an error or if the kernel reported an error.
182 WARN_UNUSED_RESULT int sendNetlinkRequest(uint16_t action, uint16_t flags, iovec* iov, int iovlen) {
183     nlmsghdr nlmsg = {
184         .nlmsg_type = action,
185         .nlmsg_flags = flags,
186     };
187     iov[0].iov_base = &nlmsg;
188     iov[0].iov_len = sizeof(nlmsg);
189     for (int i = 0; i < iovlen; ++i) {
190         nlmsg.nlmsg_len += iov[i].iov_len;
191     }
192
193     int ret;
194     struct {
195         nlmsghdr msg;
196         nlmsgerr err;
197     } response;
198
199     int sock = socket(AF_NETLINK, SOCK_DGRAM, NETLINK_ROUTE);
200     if (sock != -1 &&
201             connect(sock, reinterpret_cast<const sockaddr*>(&NETLINK_ADDRESS),
202                     sizeof(NETLINK_ADDRESS)) != -1 &&
203             writev(sock, iov, iovlen) != -1 &&
204             (ret = recv(sock, &response, sizeof(response), 0)) != -1) {
205         if (ret == sizeof(response)) {
206             ret = response.err.error;  // Netlink errors are negative errno.
207             if (ret) {
208                 ALOGE("netlink response contains error (%s)", strerror(-ret));
209             }
210         } else {
211             ALOGE("bad netlink response message size (%d != %zu)", ret, sizeof(response));
212             ret = -EBADMSG;
213         }
214     } else {
215         ALOGE("netlink socket/connect/writev/recv failed (%s)", strerror(errno));
216         ret = -errno;
217     }
218
219     if (sock != -1) {
220         close(sock);
221     }
222
223     return ret;
224 }
225
226 // Returns 0 on success or negative errno on failure.
227 int padInterfaceName(const char* input, char* name, size_t* length, uint16_t* padding) {
228     if (!input) {
229         *length = 0;
230         *padding = 0;
231         return 0;
232     }
233     *length = strlcpy(name, input, IFNAMSIZ) + 1;
234     if (*length > IFNAMSIZ) {
235         ALOGE("interface name too long (%zu > %u)", *length, IFNAMSIZ);
236         return -ENAMETOOLONG;
237     }
238     *padding = RTA_SPACE(*length) - RTA_LENGTH(*length);
239     return 0;
240 }
241
242 // Adds or removes a routing rule for IPv4 and IPv6.
243 //
244 // + If |table| is non-zero, the rule points at the specified routing table. Otherwise, the rule
245 //   returns ENETUNREACH.
246 // + If |mask| is non-zero, the rule matches the specified fwmark and mask. Otherwise, |fwmark| is
247 //   ignored.
248 // + If |iif| is non-NULL, the rule matches the specified incoming interface.
249 // + If |oif| is non-NULL, the rule matches the specified outgoing interface.
250 // + If |uidStart| and |uidEnd| are not INVALID_UID, the rule matches packets from UIDs in that
251 //   range (inclusive). Otherwise, the rule matches packets from all UIDs.
252 //
253 // Returns 0 on success or negative errno on failure.
254 WARN_UNUSED_RESULT int modifyIpRule(uint16_t action, uint32_t priority, uint32_t table,
255                                     uint32_t fwmark, uint32_t mask, const char* iif,
256                                     const char* oif, uid_t uidStart, uid_t uidEnd) {
257     // Ensure that if you set a bit in the fwmark, it's not being ignored by the mask.
258     if (fwmark & ~mask) {
259         ALOGE("mask 0x%x does not select all the bits set in fwmark 0x%x", mask, fwmark);
260         return -ERANGE;
261     }
262
263     // Interface names must include exactly one terminating NULL and be properly padded, or older
264     // kernels will refuse to delete rules.
265     char iifName[IFNAMSIZ], oifName[IFNAMSIZ];
266     size_t iifLength, oifLength;
267     uint16_t iifPadding, oifPadding;
268     if (int ret = padInterfaceName(iif, iifName, &iifLength, &iifPadding)) {
269         return ret;
270     }
271     if (int ret = padInterfaceName(oif, oifName, &oifLength, &oifPadding)) {
272         return ret;
273     }
274
275     // Either both start and end UID must be specified, or neither.
276     if ((uidStart == INVALID_UID) != (uidEnd == INVALID_UID)) {
277         ALOGE("incompatible start and end UIDs (%u vs %u)", uidStart, uidEnd);
278         return -EUSERS;
279     }
280     bool isUidRule = (uidStart != INVALID_UID);
281
282     // Assemble a rule request and put it in an array of iovec structures.
283     fib_rule_hdr rule = {
284         .action = static_cast<uint8_t>(table != RT_TABLE_UNSPEC ? FR_ACT_TO_TBL :
285                                                                   FR_ACT_UNREACHABLE),
286     };
287
288     rtattr fraIifName = { U16_RTA_LENGTH(iifLength), FRA_IIFNAME };
289     rtattr fraOifName = { U16_RTA_LENGTH(oifLength), FRA_OIFNAME };
290
291     iovec iov[] = {
292         { NULL,              0 },
293         { &rule,             sizeof(rule) },
294         { &FRATTR_PRIORITY,  sizeof(FRATTR_PRIORITY) },
295         { &priority,         sizeof(priority) },
296         { &FRATTR_TABLE,     table != RT_TABLE_UNSPEC ? sizeof(FRATTR_TABLE) : 0 },
297         { &table,            table != RT_TABLE_UNSPEC ? sizeof(table) : 0 },
298         { &FRATTR_FWMARK,    mask ? sizeof(FRATTR_FWMARK) : 0 },
299         { &fwmark,           mask ? sizeof(fwmark) : 0 },
300         { &FRATTR_FWMASK,    mask ? sizeof(FRATTR_FWMASK) : 0 },
301         { &mask,             mask ? sizeof(mask) : 0 },
302         { &FRATTR_UID_START, isUidRule ? sizeof(FRATTR_UID_START) : 0 },
303         { &uidStart,         isUidRule ? sizeof(uidStart) : 0 },
304         { &FRATTR_UID_END,   isUidRule ? sizeof(FRATTR_UID_END) : 0 },
305         { &uidEnd,           isUidRule ? sizeof(uidEnd) : 0 },
306         { &fraIifName,       iif != IIF_NONE ? sizeof(fraIifName) : 0 },
307         { iifName,           iifLength },
308         { PADDING_BUFFER,    iifPadding },
309         { &fraOifName,       oif != OIF_NONE ? sizeof(fraOifName) : 0 },
310         { oifName,           oifLength },
311         { PADDING_BUFFER,    oifPadding },
312     };
313
314     uint16_t flags = (action == RTM_NEWRULE) ? NETLINK_CREATE_REQUEST_FLAGS : NETLINK_REQUEST_FLAGS;
315     for (size_t i = 0; i < ARRAY_SIZE(AF_FAMILIES); ++i) {
316         rule.family = AF_FAMILIES[i];
317         if (int ret = sendNetlinkRequest(action, flags, iov, ARRAY_SIZE(iov))) {
318             return ret;
319         }
320     }
321
322     return 0;
323 }
324
325 WARN_UNUSED_RESULT int modifyIpRule(uint16_t action, uint32_t priority, uint32_t table,
326                                     uint32_t fwmark, uint32_t mask) {
327     return modifyIpRule(action, priority, table, fwmark, mask, IIF_NONE, OIF_NONE, INVALID_UID,
328                         INVALID_UID);
329 }
330
331 // Adds or deletes an IPv4 or IPv6 route.
332 // Returns 0 on success or negative errno on failure.
333 WARN_UNUSED_RESULT int modifyIpRoute(uint16_t action, uint32_t table, const char* interface,
334                                      const char* destination, const char* nexthop) {
335     // At least the destination must be non-null.
336     if (!destination) {
337         ALOGE("null destination");
338         return -EFAULT;
339     }
340
341     // Parse the prefix.
342     uint8_t rawAddress[sizeof(in6_addr)];
343     uint8_t family;
344     uint8_t prefixLength;
345     int rawLength = parsePrefix(destination, &family, rawAddress, sizeof(rawAddress),
346                                 &prefixLength);
347     if (rawLength < 0) {
348         ALOGE("parsePrefix failed for destination %s (%s)", destination, strerror(-rawLength));
349         return rawLength;
350     }
351
352     if (static_cast<size_t>(rawLength) > sizeof(rawAddress)) {
353         ALOGE("impossible! address too long (%d vs %zu)", rawLength, sizeof(rawAddress));
354         return -ENOBUFS;  // Cannot happen; parsePrefix only supports IPv4 and IPv6.
355     }
356
357     // If an interface was specified, find the ifindex.
358     uint32_t ifindex;
359     if (interface != OIF_NONE) {
360         ifindex = if_nametoindex(interface);
361         if (!ifindex) {
362             ALOGE("cannot find interface %s", interface);
363             return -ENODEV;
364         }
365     }
366
367     // If a nexthop was specified, parse it as the same family as the prefix.
368     uint8_t rawNexthop[sizeof(in6_addr)];
369     if (nexthop && inet_pton(family, nexthop, rawNexthop) <= 0) {
370         ALOGE("inet_pton failed for nexthop %s", nexthop);
371         return -EINVAL;
372     }
373
374     // Assemble a rtmsg and put it in an array of iovec structures.
375     rtmsg route = {
376         .rtm_protocol = RTPROT_STATIC,
377         .rtm_type = RTN_UNICAST,
378         .rtm_family = family,
379         .rtm_dst_len = prefixLength,
380     };
381
382     rtattr rtaDst     = { U16_RTA_LENGTH(rawLength), RTA_DST };
383     rtattr rtaGateway = { U16_RTA_LENGTH(rawLength), RTA_GATEWAY };
384
385     iovec iov[] = {
386         { NULL,          0 },
387         { &route,        sizeof(route) },
388         { &RTATTR_TABLE, sizeof(RTATTR_TABLE) },
389         { &table,        sizeof(table) },
390         { &rtaDst,       sizeof(rtaDst) },
391         { rawAddress,    static_cast<size_t>(rawLength) },
392         { &RTATTR_OIF,   interface != OIF_NONE ? sizeof(RTATTR_OIF) : 0 },
393         { &ifindex,      interface != OIF_NONE ? sizeof(ifindex) : 0 },
394         { &rtaGateway,   nexthop ? sizeof(rtaGateway) : 0 },
395         { rawNexthop,    nexthop ? static_cast<size_t>(rawLength) : 0 },
396     };
397
398     uint16_t flags = (action == RTM_NEWROUTE) ? NETLINK_CREATE_REQUEST_FLAGS :
399                                                 NETLINK_REQUEST_FLAGS;
400     return sendNetlinkRequest(action, flags, iov, ARRAY_SIZE(iov));
401 }
402
403 // An iptables rule to mark incoming packets on a network with the netId of the network.
404 //
405 // This is so that the kernel can:
406 // + Use the right fwmark for (and thus correctly route) replies (e.g.: TCP RST, ICMP errors, ping
407 //   replies, SYN-ACKs, etc).
408 // + Mark sockets that accept connections from this interface so that the connection stays on the
409 //   same interface.
410 WARN_UNUSED_RESULT int modifyIncomingPacketMark(unsigned netId, const char* interface,
411                                                 Permission permission, bool add) {
412     Fwmark fwmark;
413
414     fwmark.netId = netId;
415     fwmark.explicitlySelected = true;
416     fwmark.protectedFromVpn = true;
417     fwmark.permission = permission;
418
419     char markString[UINT32_HEX_STRLEN];
420     snprintf(markString, sizeof(markString), "0x%x", fwmark.intValue);
421
422     if (execIptables(V4V6, "-t", "mangle", add ? "-A" : "-D", "INPUT", "-i", interface, "-j",
423                      "MARK", "--set-mark", markString, NULL)) {
424         ALOGE("failed to change iptables rule that sets incoming packet mark");
425         return -EREMOTEIO;
426     }
427
428     return 0;
429 }
430
431 // A rule to route responses to the local network forwarded via the VPN.
432 //
433 // When a VPN is in effect, packets from the local network to upstream networks are forwarded into
434 // the VPN's tunnel interface. When the VPN forwards the responses, they emerge out of the tunnel.
435 WARN_UNUSED_RESULT int modifyVpnOutputToLocalRule(const char* vpnInterface, bool add) {
436     return modifyIpRule(add ? RTM_NEWRULE : RTM_DELRULE, RULE_PRIORITY_VPN_OUTPUT_TO_LOCAL,
437                         ROUTE_TABLE_LOCAL_NETWORK, MARK_UNSET, MARK_UNSET, vpnInterface, OIF_NONE,
438                         INVALID_UID, INVALID_UID);
439 }
440
441 // A rule to route all traffic from a given set of UIDs to go over the VPN.
442 //
443 // Notice that this rule doesn't use the netId. I.e., no matter what netId the user's socket may
444 // have, if they are subject to this VPN, their traffic has to go through it. Allows the traffic to
445 // bypass the VPN if the protectedFromVpn bit is set.
446 WARN_UNUSED_RESULT int modifyVpnUidRangeRule(uint32_t table, uid_t uidStart, uid_t uidEnd,
447                                              bool secure, bool add) {
448     Fwmark fwmark;
449     Fwmark mask;
450
451     fwmark.protectedFromVpn = false;
452     mask.protectedFromVpn = true;
453
454     uint32_t priority;
455
456     if (secure) {
457         priority = RULE_PRIORITY_SECURE_VPN;
458     } else {
459         priority = RULE_PRIORITY_BYPASSABLE_VPN;
460
461         fwmark.explicitlySelected = false;
462         mask.explicitlySelected = true;
463     }
464
465     return modifyIpRule(add ? RTM_NEWRULE : RTM_DELRULE, priority, table, fwmark.intValue,
466                         mask.intValue, IIF_NONE, OIF_NONE, uidStart, uidEnd);
467 }
468
469 // A rule to allow system apps to send traffic over this VPN even if they are not part of the target
470 // set of UIDs.
471 //
472 // This is needed for DnsProxyListener to correctly resolve a request for a user who is in the
473 // target set, but where the DnsProxyListener itself is not.
474 WARN_UNUSED_RESULT int modifyVpnSystemPermissionRule(unsigned netId, uint32_t table, bool secure,
475                                                      bool add) {
476     Fwmark fwmark;
477     Fwmark mask;
478
479     fwmark.netId = netId;
480     mask.netId = FWMARK_NET_ID_MASK;
481
482     fwmark.permission = PERMISSION_SYSTEM;
483     mask.permission = PERMISSION_SYSTEM;
484
485     uint32_t priority = secure ? RULE_PRIORITY_SECURE_VPN : RULE_PRIORITY_BYPASSABLE_VPN;
486
487     return modifyIpRule(add ? RTM_NEWRULE : RTM_DELRULE, priority, table, fwmark.intValue,
488                         mask.intValue);
489 }
490
491 // A rule to route traffic based on an explicitly chosen network.
492 //
493 // Supports apps that use the multinetwork APIs to restrict their traffic to a network.
494 //
495 // Even though we check permissions at the time we set a netId into the fwmark of a socket, we need
496 // to check it again in the rules here, because a network's permissions may have been updated via
497 // modifyNetworkPermission().
498 WARN_UNUSED_RESULT int modifyExplicitNetworkRule(unsigned netId, uint32_t table,
499                                                  Permission permission, uid_t uidStart,
500                                                  uid_t uidEnd, bool add) {
501     Fwmark fwmark;
502     Fwmark mask;
503
504     fwmark.netId = netId;
505     mask.netId = FWMARK_NET_ID_MASK;
506
507     fwmark.explicitlySelected = true;
508     mask.explicitlySelected = true;
509
510     fwmark.permission = permission;
511     mask.permission = permission;
512
513     return modifyIpRule(add ? RTM_NEWRULE : RTM_DELRULE, RULE_PRIORITY_EXPLICIT_NETWORK, table,
514                         fwmark.intValue, mask.intValue, IIF_NONE, OIF_NONE, uidStart, uidEnd);
515 }
516
517 // A rule to route traffic based on a chosen outgoing interface.
518 //
519 // Supports apps that use SO_BINDTODEVICE or IP_PKTINFO options and the kernel that already knows
520 // the outgoing interface (typically for link-local communications).
521 WARN_UNUSED_RESULT int modifyOutputInterfaceRule(const char* interface, uint32_t table,
522                                                  Permission permission, uid_t uidStart,
523                                                  uid_t uidEnd, bool add) {
524     Fwmark fwmark;
525     Fwmark mask;
526
527     fwmark.permission = permission;
528     mask.permission = permission;
529
530     return modifyIpRule(add ? RTM_NEWRULE : RTM_DELRULE, RULE_PRIORITY_OUTPUT_INTERFACE, table,
531                         fwmark.intValue, mask.intValue, IIF_NONE, interface, uidStart, uidEnd);
532 }
533
534 // A rule to route traffic based on the chosen network.
535 //
536 // This is for sockets that have not explicitly requested a particular network, but have been
537 // bound to one when they called connect(). This ensures that sockets connected on a particular
538 // network stay on that network even if the default network changes.
539 WARN_UNUSED_RESULT int modifyImplicitNetworkRule(unsigned netId, uint32_t table,
540                                                  Permission permission, bool add) {
541     Fwmark fwmark;
542     Fwmark mask;
543
544     fwmark.netId = netId;
545     mask.netId = FWMARK_NET_ID_MASK;
546
547     fwmark.explicitlySelected = false;
548     mask.explicitlySelected = true;
549
550     fwmark.permission = permission;
551     mask.permission = permission;
552
553     return modifyIpRule(add ? RTM_NEWRULE : RTM_DELRULE, RULE_PRIORITY_IMPLICIT_NETWORK, table,
554                         fwmark.intValue, mask.intValue);
555 }
556
557 // A rule to enable split tunnel VPNs.
558 //
559 // If a packet with a VPN's netId doesn't find a route in the VPN's routing table, it's allowed to
560 // go over the default network, provided it wasn't explicitly restricted to the VPN and has the
561 // permissions required by the default network.
562 WARN_UNUSED_RESULT int modifyVpnFallthroughRule(uint16_t action, unsigned vpnNetId,
563                                                 const char* physicalInterface,
564                                                 Permission permission) {
565     uint32_t table = getRouteTableForInterface(physicalInterface);
566     if (table == RT_TABLE_UNSPEC) {
567         return -ESRCH;
568     }
569
570     Fwmark fwmark;
571     Fwmark mask;
572
573     fwmark.netId = vpnNetId;
574     mask.netId = FWMARK_NET_ID_MASK;
575
576     fwmark.explicitlySelected = false;
577     mask.explicitlySelected = true;
578
579     fwmark.permission = permission;
580     mask.permission = permission;
581
582     return modifyIpRule(action, RULE_PRIORITY_VPN_FALLTHROUGH, table, fwmark.intValue,
583                         mask.intValue);
584 }
585
586 // Add rules to allow legacy routes added through the requestRouteToHost() API.
587 WARN_UNUSED_RESULT int addLegacyRouteRules() {
588     Fwmark fwmark;
589     Fwmark mask;
590
591     fwmark.explicitlySelected = false;
592     mask.explicitlySelected = true;
593
594     // Rules to allow legacy routes to override the default network.
595     if (int ret = modifyIpRule(RTM_NEWRULE, RULE_PRIORITY_LEGACY_SYSTEM, ROUTE_TABLE_LEGACY_SYSTEM,
596                                fwmark.intValue, mask.intValue)) {
597         return ret;
598     }
599     if (int ret = modifyIpRule(RTM_NEWRULE, RULE_PRIORITY_LEGACY_NETWORK,
600                                ROUTE_TABLE_LEGACY_NETWORK, fwmark.intValue, mask.intValue)) {
601         return ret;
602     }
603
604     fwmark.permission = PERMISSION_SYSTEM;
605     mask.permission = PERMISSION_SYSTEM;
606
607     // A rule to allow legacy routes from system apps to override VPNs.
608     return modifyIpRule(RTM_NEWRULE, RULE_PRIORITY_VPN_OVERRIDE_SYSTEM, ROUTE_TABLE_LEGACY_SYSTEM,
609                         fwmark.intValue, mask.intValue);
610 }
611
612 // Add rules to lookup the local network when specified explicitly or otherwise.
613 WARN_UNUSED_RESULT int addLocalNetworkRules(unsigned localNetId) {
614     if (int ret = modifyExplicitNetworkRule(localNetId, ROUTE_TABLE_LOCAL_NETWORK, PERMISSION_NONE,
615                                             INVALID_UID, INVALID_UID, ACTION_ADD)) {
616         return ret;
617     }
618
619     Fwmark fwmark;
620     Fwmark mask;
621
622     fwmark.explicitlySelected = false;
623     mask.explicitlySelected = true;
624
625     return modifyIpRule(RTM_NEWRULE, RULE_PRIORITY_LOCAL_NETWORK, ROUTE_TABLE_LOCAL_NETWORK,
626                         fwmark.intValue, mask.intValue);
627 }
628
629 // Add a new rule to look up the 'main' table, with the same selectors as the "default network"
630 // rule, but with a lower priority. Since the default network rule points to a table with a default
631 // route, the rule we're adding will never be used for normal routing lookups. However, the kernel
632 // may fall-through to it to find directly-connected routes when it validates that a nexthop (in a
633 // route being added) is reachable.
634 WARN_UNUSED_RESULT int addDirectlyConnectedRule() {
635     Fwmark fwmark;
636     Fwmark mask;
637
638     fwmark.netId = NETID_UNSET;
639     mask.netId = FWMARK_NET_ID_MASK;
640
641     return modifyIpRule(RTM_NEWRULE, RULE_PRIORITY_DIRECTLY_CONNECTED, RT_TABLE_MAIN,
642                         fwmark.intValue, mask.intValue, IIF_NONE, OIF_NONE, UID_ROOT, UID_ROOT);
643 }
644
645 // Add a rule to preempt the pre-defined "from all lookup main" rule. Packets that reach this rule
646 // will be null-routed, and won't fall-through to the main table.
647 WARN_UNUSED_RESULT int addUnreachableRule() {
648     return modifyIpRule(RTM_NEWRULE, RULE_PRIORITY_UNREACHABLE, RT_TABLE_UNSPEC, MARK_UNSET,
649                         MARK_UNSET);
650 }
651
652 WARN_UNUSED_RESULT int modifyLocalNetwork(unsigned netId, const char* interface, bool add) {
653     if (int ret = modifyIncomingPacketMark(netId, interface, PERMISSION_NONE, add)) {
654         return ret;
655     }
656     return modifyOutputInterfaceRule(interface, ROUTE_TABLE_LOCAL_NETWORK, PERMISSION_NONE,
657                                      INVALID_UID, INVALID_UID, add);
658 }
659
660 WARN_UNUSED_RESULT int modifyPhysicalNetwork(unsigned netId, const char* interface,
661                                              Permission permission, bool add) {
662     uint32_t table = getRouteTableForInterface(interface);
663     if (table == RT_TABLE_UNSPEC) {
664         return -ESRCH;
665     }
666
667     if (int ret = modifyIncomingPacketMark(netId, interface, permission, add)) {
668         return ret;
669     }
670     if (int ret = modifyExplicitNetworkRule(netId, table, permission, INVALID_UID, INVALID_UID,
671                                             add)) {
672         return ret;
673     }
674     if (int ret = modifyOutputInterfaceRule(interface, table, permission, INVALID_UID, INVALID_UID,
675                                             add)) {
676         return ret;
677     }
678     return modifyImplicitNetworkRule(netId, table, permission, add);
679 }
680
681 WARN_UNUSED_RESULT int modifyVirtualNetwork(unsigned netId, const char* interface,
682                                             const UidRanges& uidRanges, bool secure, bool add,
683                                             bool modifyNonUidBasedRules) {
684     uint32_t table = getRouteTableForInterface(interface);
685     if (table == RT_TABLE_UNSPEC) {
686         return -ESRCH;
687     }
688
689     for (const UidRanges::Range& range : uidRanges.getRanges()) {
690         if (int ret = modifyVpnUidRangeRule(table, range.first, range.second, secure, add)) {
691             return ret;
692         }
693         if (int ret = modifyExplicitNetworkRule(netId, table, PERMISSION_NONE, range.first,
694                                                 range.second, add)) {
695             return ret;
696         }
697         if (int ret = modifyOutputInterfaceRule(interface, table, PERMISSION_NONE, range.first,
698                                                 range.second, add)) {
699             return ret;
700         }
701     }
702
703     if (modifyNonUidBasedRules) {
704         if (int ret = modifyIncomingPacketMark(netId, interface, PERMISSION_NONE, add)) {
705             return ret;
706         }
707         if (int ret = modifyVpnOutputToLocalRule(interface, add)) {
708             return ret;
709         }
710         if (int ret = modifyVpnSystemPermissionRule(netId, table, secure, add)) {
711             return ret;
712         }
713         return modifyExplicitNetworkRule(netId, table, PERMISSION_NONE, UID_ROOT, UID_ROOT, add);
714     }
715
716     return 0;
717 }
718
719 WARN_UNUSED_RESULT int modifyDefaultNetwork(uint16_t action, const char* interface,
720                                             Permission permission) {
721     uint32_t table = getRouteTableForInterface(interface);
722     if (table == RT_TABLE_UNSPEC) {
723         return -ESRCH;
724     }
725
726     Fwmark fwmark;
727     Fwmark mask;
728
729     fwmark.netId = NETID_UNSET;
730     mask.netId = FWMARK_NET_ID_MASK;
731
732     fwmark.permission = permission;
733     mask.permission = permission;
734
735     return modifyIpRule(action, RULE_PRIORITY_DEFAULT_NETWORK, table, fwmark.intValue,
736                         mask.intValue);
737 }
738
739 WARN_UNUSED_RESULT int modifyTetheredNetwork(uint16_t action, const char* inputInterface,
740                                              const char* outputInterface) {
741     uint32_t table = getRouteTableForInterface(outputInterface);
742     if (table == RT_TABLE_UNSPEC) {
743         return -ESRCH;
744     }
745
746     return modifyIpRule(action, RULE_PRIORITY_TETHERING, table, MARK_UNSET, MARK_UNSET,
747                         inputInterface, OIF_NONE, INVALID_UID, INVALID_UID);
748 }
749
750 // Returns 0 on success or negative errno on failure.
751 WARN_UNUSED_RESULT int flushRules() {
752     for (size_t i = 0; i < ARRAY_SIZE(IP_VERSIONS); ++i) {
753         const char* argv[] = {
754             IP_PATH,
755             IP_VERSIONS[i],
756             "rule",
757             "flush",
758         };
759         if (android_fork_execvp(ARRAY_SIZE(argv), const_cast<char**>(argv), NULL, false, false)) {
760             ALOGE("failed to flush rules");
761             return -EREMOTEIO;
762         }
763     }
764     return 0;
765 }
766
767 // Adds or removes an IPv4 or IPv6 route to the specified table and, if it's a directly-connected
768 // route, to the main table as well.
769 // Returns 0 on success or negative errno on failure.
770 WARN_UNUSED_RESULT int modifyRoute(uint16_t action, const char* interface, const char* destination,
771                                    const char* nexthop, RouteController::TableType tableType) {
772     uint32_t table;
773     switch (tableType) {
774         case RouteController::INTERFACE: {
775             table = getRouteTableForInterface(interface);
776             if (table == RT_TABLE_UNSPEC) {
777                 return -ESRCH;
778             }
779             break;
780         }
781         case RouteController::LOCAL_NETWORK: {
782             table = ROUTE_TABLE_LOCAL_NETWORK;
783             break;
784         }
785         case RouteController::LEGACY_NETWORK: {
786             table = ROUTE_TABLE_LEGACY_NETWORK;
787             break;
788         }
789         case RouteController::LEGACY_SYSTEM: {
790             table = ROUTE_TABLE_LEGACY_SYSTEM;
791             break;
792         }
793     }
794
795     int ret = modifyIpRoute(action, table, interface, destination, nexthop);
796     // We allow apps to call requestRouteToHost() multiple times with the same route, so ignore
797     // EEXIST failures when adding routes to legacy tables.
798     if (ret && !(action == RTM_NEWROUTE && ret == -EEXIST &&
799                  (tableType == RouteController::LEGACY_NETWORK ||
800                   tableType == RouteController::LEGACY_SYSTEM))) {
801         return ret;
802     }
803
804     // If there's no nexthop, this is a directly connected route. Add it to the main table also, to
805     // let the kernel find it when validating nexthops when global routes are added.
806     if (!nexthop) {
807         ret = modifyIpRoute(action, RT_TABLE_MAIN, interface, destination, NULL);
808         // A failure with action == ADD && errno == EEXIST means that the route already exists in
809         // the main table, perhaps because the kernel added it automatically as part of adding the
810         // IP address to the interface. Ignore this, but complain about everything else.
811         if (ret && !(action == RTM_NEWROUTE && ret == -EEXIST)) {
812             return ret;
813         }
814     }
815
816     return 0;
817 }
818
819 // Returns 0 on success or negative errno on failure.
820 WARN_UNUSED_RESULT int flushRoutes(const char* interface) {
821     uint32_t table = getRouteTableForInterface(interface);
822     if (table == RT_TABLE_UNSPEC) {
823         return -ESRCH;
824     }
825
826     char tableString[UINT32_STRLEN];
827     snprintf(tableString, sizeof(tableString), "%u", table);
828
829     for (size_t i = 0; i < ARRAY_SIZE(IP_VERSIONS); ++i) {
830         const char* argv[] = {
831             IP_PATH,
832             IP_VERSIONS[i],
833             "route",
834             "flush",
835             "table",
836             tableString,
837         };
838         if (android_fork_execvp(ARRAY_SIZE(argv), const_cast<char**>(argv), NULL, false, false)) {
839             ALOGE("failed to flush routes");
840             return -EREMOTEIO;
841         }
842     }
843
844     interfaceToTable.erase(interface);
845     return 0;
846 }
847
848 }  // namespace
849
850 int RouteController::Init(unsigned localNetId) {
851     if (int ret = flushRules()) {
852         return ret;
853     }
854     if (int ret = addLegacyRouteRules()) {
855         return ret;
856     }
857     if (int ret = addLocalNetworkRules(localNetId)) {
858         return ret;
859     }
860     if (int ret = addDirectlyConnectedRule()) {
861         return ret;
862     }
863     if (int ret = addUnreachableRule()) {
864         return ret;
865     }
866     updateTableNamesFile();
867     return 0;
868 }
869
870 int RouteController::addInterfaceToLocalNetwork(unsigned netId, const char* interface) {
871     return modifyLocalNetwork(netId, interface, ACTION_ADD);
872 }
873
874 int RouteController::removeInterfaceFromLocalNetwork(unsigned netId, const char* interface) {
875     return modifyLocalNetwork(netId, interface, ACTION_DEL);
876 }
877
878 int RouteController::addInterfaceToPhysicalNetwork(unsigned netId, const char* interface,
879                                                    Permission permission) {
880     if (int ret = modifyPhysicalNetwork(netId, interface, permission, ACTION_ADD)) {
881         return ret;
882     }
883     updateTableNamesFile();
884     return 0;
885 }
886
887 int RouteController::removeInterfaceFromPhysicalNetwork(unsigned netId, const char* interface,
888                                                         Permission permission) {
889     if (int ret = modifyPhysicalNetwork(netId, interface, permission, ACTION_DEL)) {
890         return ret;
891     }
892     if (int ret = flushRoutes(interface)) {
893         return ret;
894     }
895     updateTableNamesFile();
896     return 0;
897 }
898
899 int RouteController::addInterfaceToVirtualNetwork(unsigned netId, const char* interface,
900                                                   bool secure, const UidRanges& uidRanges) {
901     if (int ret = modifyVirtualNetwork(netId, interface, uidRanges, secure, ACTION_ADD,
902                                        MODIFY_NON_UID_BASED_RULES)) {
903         return ret;
904     }
905     updateTableNamesFile();
906     return 0;
907 }
908
909 int RouteController::removeInterfaceFromVirtualNetwork(unsigned netId, const char* interface,
910                                                        bool secure, const UidRanges& uidRanges) {
911     if (int ret = modifyVirtualNetwork(netId, interface, uidRanges, secure, ACTION_DEL,
912                                        MODIFY_NON_UID_BASED_RULES)) {
913         return ret;
914     }
915     if (int ret = flushRoutes(interface)) {
916         return ret;
917     }
918     updateTableNamesFile();
919     return 0;
920 }
921
922 int RouteController::modifyPhysicalNetworkPermission(unsigned netId, const char* interface,
923                                                      Permission oldPermission,
924                                                      Permission newPermission) {
925     // Add the new rules before deleting the old ones, to avoid race conditions.
926     if (int ret = modifyPhysicalNetwork(netId, interface, newPermission, ACTION_ADD)) {
927         return ret;
928     }
929     return modifyPhysicalNetwork(netId, interface, oldPermission, ACTION_DEL);
930 }
931
932 int RouteController::addUsersToVirtualNetwork(unsigned netId, const char* interface, bool secure,
933                                               const UidRanges& uidRanges) {
934     return modifyVirtualNetwork(netId, interface, uidRanges, secure, ACTION_ADD,
935                                 !MODIFY_NON_UID_BASED_RULES);
936 }
937
938 int RouteController::removeUsersFromVirtualNetwork(unsigned netId, const char* interface,
939                                                    bool secure, const UidRanges& uidRanges) {
940     return modifyVirtualNetwork(netId, interface, uidRanges, secure, ACTION_DEL,
941                                 !MODIFY_NON_UID_BASED_RULES);
942 }
943
944 int RouteController::addInterfaceToDefaultNetwork(const char* interface, Permission permission) {
945     return modifyDefaultNetwork(RTM_NEWRULE, interface, permission);
946 }
947
948 int RouteController::removeInterfaceFromDefaultNetwork(const char* interface,
949                                                        Permission permission) {
950     return modifyDefaultNetwork(RTM_DELRULE, interface, permission);
951 }
952
953 int RouteController::addRoute(const char* interface, const char* destination, const char* nexthop,
954                               TableType tableType) {
955     return modifyRoute(RTM_NEWROUTE, interface, destination, nexthop, tableType);
956 }
957
958 int RouteController::removeRoute(const char* interface, const char* destination,
959                                  const char* nexthop, TableType tableType) {
960     return modifyRoute(RTM_DELROUTE, interface, destination, nexthop, tableType);
961 }
962
963 int RouteController::enableTethering(const char* inputInterface, const char* outputInterface) {
964     return modifyTetheredNetwork(RTM_NEWRULE, inputInterface, outputInterface);
965 }
966
967 int RouteController::disableTethering(const char* inputInterface, const char* outputInterface) {
968     return modifyTetheredNetwork(RTM_DELRULE, inputInterface, outputInterface);
969 }
970
971 int RouteController::addVirtualNetworkFallthrough(unsigned vpnNetId, const char* physicalInterface,
972                                                   Permission permission) {
973     return modifyVpnFallthroughRule(RTM_NEWRULE, vpnNetId, physicalInterface, permission);
974 }
975
976 int RouteController::removeVirtualNetworkFallthrough(unsigned vpnNetId,
977                                                      const char* physicalInterface,
978                                                      Permission permission) {
979     return modifyVpnFallthroughRule(RTM_DELRULE, vpnNetId, physicalInterface, permission);
980 }