sctp: Replace use of sockets_allocated with specified macro.
[muen/linux.git] / net / sctp / socket.c
1 /* SCTP kernel implementation
2  * (C) Copyright IBM Corp. 2001, 2004
3  * Copyright (c) 1999-2000 Cisco, Inc.
4  * Copyright (c) 1999-2001 Motorola, Inc.
5  * Copyright (c) 2001-2003 Intel Corp.
6  * Copyright (c) 2001-2002 Nokia, Inc.
7  * Copyright (c) 2001 La Monte H.P. Yarroll
8  *
9  * This file is part of the SCTP kernel implementation
10  *
11  * These functions interface with the sockets layer to implement the
12  * SCTP Extensions for the Sockets API.
13  *
14  * Note that the descriptions from the specification are USER level
15  * functions--this file is the functions which populate the struct proto
16  * for SCTP which is the BOTTOM of the sockets interface.
17  *
18  * This SCTP implementation is free software;
19  * you can redistribute it and/or modify it under the terms of
20  * the GNU General Public License as published by
21  * the Free Software Foundation; either version 2, or (at your option)
22  * any later version.
23  *
24  * This SCTP implementation is distributed in the hope that it
25  * will be useful, but WITHOUT ANY WARRANTY; without even the implied
26  *                 ************************
27  * warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
28  * See the GNU General Public License for more details.
29  *
30  * You should have received a copy of the GNU General Public License
31  * along with GNU CC; see the file COPYING.  If not, see
32  * <http://www.gnu.org/licenses/>.
33  *
34  * Please send any bug reports or fixes you make to the
35  * email address(es):
36  *    lksctp developers <linux-sctp@vger.kernel.org>
37  *
38  * Written or modified by:
39  *    La Monte H.P. Yarroll <piggy@acm.org>
40  *    Narasimha Budihal     <narsi@refcode.org>
41  *    Karl Knutson          <karl@athena.chicago.il.us>
42  *    Jon Grimm             <jgrimm@us.ibm.com>
43  *    Xingang Guo           <xingang.guo@intel.com>
44  *    Daisy Chang           <daisyc@us.ibm.com>
45  *    Sridhar Samudrala     <samudrala@us.ibm.com>
46  *    Inaky Perez-Gonzalez  <inaky.gonzalez@intel.com>
47  *    Ardelle Fan           <ardelle.fan@intel.com>
48  *    Ryan Layer            <rmlayer@us.ibm.com>
49  *    Anup Pemmaiah         <pemmaiah@cc.usu.edu>
50  *    Kevin Gao             <kevin.gao@intel.com>
51  */
52
53 #define pr_fmt(fmt) KBUILD_MODNAME ": " fmt
54
55 #include <crypto/hash.h>
56 #include <linux/types.h>
57 #include <linux/kernel.h>
58 #include <linux/wait.h>
59 #include <linux/time.h>
60 #include <linux/sched/signal.h>
61 #include <linux/ip.h>
62 #include <linux/capability.h>
63 #include <linux/fcntl.h>
64 #include <linux/poll.h>
65 #include <linux/init.h>
66 #include <linux/slab.h>
67 #include <linux/file.h>
68 #include <linux/compat.h>
69
70 #include <net/ip.h>
71 #include <net/icmp.h>
72 #include <net/route.h>
73 #include <net/ipv6.h>
74 #include <net/inet_common.h>
75 #include <net/busy_poll.h>
76
77 #include <linux/socket.h> /* for sa_family_t */
78 #include <linux/export.h>
79 #include <net/sock.h>
80 #include <net/sctp/sctp.h>
81 #include <net/sctp/sm.h>
82 #include <net/sctp/stream_sched.h>
83
84 /* Forward declarations for internal helper functions. */
85 static int sctp_writeable(struct sock *sk);
86 static void sctp_wfree(struct sk_buff *skb);
87 static int sctp_wait_for_sndbuf(struct sctp_association *asoc, long *timeo_p,
88                                 size_t msg_len, struct sock **orig_sk);
89 static int sctp_wait_for_packet(struct sock *sk, int *err, long *timeo_p);
90 static int sctp_wait_for_connect(struct sctp_association *, long *timeo_p);
91 static int sctp_wait_for_accept(struct sock *sk, long timeo);
92 static void sctp_wait_for_close(struct sock *sk, long timeo);
93 static void sctp_destruct_sock(struct sock *sk);
94 static struct sctp_af *sctp_sockaddr_af(struct sctp_sock *opt,
95                                         union sctp_addr *addr, int len);
96 static int sctp_bindx_add(struct sock *, struct sockaddr *, int);
97 static int sctp_bindx_rem(struct sock *, struct sockaddr *, int);
98 static int sctp_send_asconf_add_ip(struct sock *, struct sockaddr *, int);
99 static int sctp_send_asconf_del_ip(struct sock *, struct sockaddr *, int);
100 static int sctp_send_asconf(struct sctp_association *asoc,
101                             struct sctp_chunk *chunk);
102 static int sctp_do_bind(struct sock *, union sctp_addr *, int);
103 static int sctp_autobind(struct sock *sk);
104 static void sctp_sock_migrate(struct sock *oldsk, struct sock *newsk,
105                               struct sctp_association *assoc,
106                               enum sctp_socket_type type);
107
108 static unsigned long sctp_memory_pressure;
109 static atomic_long_t sctp_memory_allocated;
110 struct percpu_counter sctp_sockets_allocated;
111
112 static void sctp_enter_memory_pressure(struct sock *sk)
113 {
114         sctp_memory_pressure = 1;
115 }
116
117
118 /* Get the sndbuf space available at the time on the association.  */
119 static inline int sctp_wspace(struct sctp_association *asoc)
120 {
121         int amt;
122
123         if (asoc->ep->sndbuf_policy)
124                 amt = asoc->sndbuf_used;
125         else
126                 amt = sk_wmem_alloc_get(asoc->base.sk);
127
128         if (amt >= asoc->base.sk->sk_sndbuf) {
129                 if (asoc->base.sk->sk_userlocks & SOCK_SNDBUF_LOCK)
130                         amt = 0;
131                 else {
132                         amt = sk_stream_wspace(asoc->base.sk);
133                         if (amt < 0)
134                                 amt = 0;
135                 }
136         } else {
137                 amt = asoc->base.sk->sk_sndbuf - amt;
138         }
139         return amt;
140 }
141
142 /* Increment the used sndbuf space count of the corresponding association by
143  * the size of the outgoing data chunk.
144  * Also, set the skb destructor for sndbuf accounting later.
145  *
146  * Since it is always 1-1 between chunk and skb, and also a new skb is always
147  * allocated for chunk bundling in sctp_packet_transmit(), we can use the
148  * destructor in the data chunk skb for the purpose of the sndbuf space
149  * tracking.
150  */
151 static inline void sctp_set_owner_w(struct sctp_chunk *chunk)
152 {
153         struct sctp_association *asoc = chunk->asoc;
154         struct sock *sk = asoc->base.sk;
155
156         /* The sndbuf space is tracked per association.  */
157         sctp_association_hold(asoc);
158
159         skb_set_owner_w(chunk->skb, sk);
160
161         chunk->skb->destructor = sctp_wfree;
162         /* Save the chunk pointer in skb for sctp_wfree to use later.  */
163         skb_shinfo(chunk->skb)->destructor_arg = chunk;
164
165         asoc->sndbuf_used += SCTP_DATA_SNDSIZE(chunk) +
166                                 sizeof(struct sk_buff) +
167                                 sizeof(struct sctp_chunk);
168
169         refcount_add(sizeof(struct sctp_chunk), &sk->sk_wmem_alloc);
170         sk->sk_wmem_queued += chunk->skb->truesize;
171         sk_mem_charge(sk, chunk->skb->truesize);
172 }
173
174 static void sctp_clear_owner_w(struct sctp_chunk *chunk)
175 {
176         skb_orphan(chunk->skb);
177 }
178
179 static void sctp_for_each_tx_datachunk(struct sctp_association *asoc,
180                                        void (*cb)(struct sctp_chunk *))
181
182 {
183         struct sctp_outq *q = &asoc->outqueue;
184         struct sctp_transport *t;
185         struct sctp_chunk *chunk;
186
187         list_for_each_entry(t, &asoc->peer.transport_addr_list, transports)
188                 list_for_each_entry(chunk, &t->transmitted, transmitted_list)
189                         cb(chunk);
190
191         list_for_each_entry(chunk, &q->retransmit, transmitted_list)
192                 cb(chunk);
193
194         list_for_each_entry(chunk, &q->sacked, transmitted_list)
195                 cb(chunk);
196
197         list_for_each_entry(chunk, &q->abandoned, transmitted_list)
198                 cb(chunk);
199
200         list_for_each_entry(chunk, &q->out_chunk_list, list)
201                 cb(chunk);
202 }
203
204 /* Verify that this is a valid address. */
205 static inline int sctp_verify_addr(struct sock *sk, union sctp_addr *addr,
206                                    int len)
207 {
208         struct sctp_af *af;
209
210         /* Verify basic sockaddr. */
211         af = sctp_sockaddr_af(sctp_sk(sk), addr, len);
212         if (!af)
213                 return -EINVAL;
214
215         /* Is this a valid SCTP address?  */
216         if (!af->addr_valid(addr, sctp_sk(sk), NULL))
217                 return -EINVAL;
218
219         if (!sctp_sk(sk)->pf->send_verify(sctp_sk(sk), (addr)))
220                 return -EINVAL;
221
222         return 0;
223 }
224
225 /* Look up the association by its id.  If this is not a UDP-style
226  * socket, the ID field is always ignored.
227  */
228 struct sctp_association *sctp_id2assoc(struct sock *sk, sctp_assoc_t id)
229 {
230         struct sctp_association *asoc = NULL;
231
232         /* If this is not a UDP-style socket, assoc id should be ignored. */
233         if (!sctp_style(sk, UDP)) {
234                 /* Return NULL if the socket state is not ESTABLISHED. It
235                  * could be a TCP-style listening socket or a socket which
236                  * hasn't yet called connect() to establish an association.
237                  */
238                 if (!sctp_sstate(sk, ESTABLISHED) && !sctp_sstate(sk, CLOSING))
239                         return NULL;
240
241                 /* Get the first and the only association from the list. */
242                 if (!list_empty(&sctp_sk(sk)->ep->asocs))
243                         asoc = list_entry(sctp_sk(sk)->ep->asocs.next,
244                                           struct sctp_association, asocs);
245                 return asoc;
246         }
247
248         /* Otherwise this is a UDP-style socket. */
249         if (!id || (id == (sctp_assoc_t)-1))
250                 return NULL;
251
252         spin_lock_bh(&sctp_assocs_id_lock);
253         asoc = (struct sctp_association *)idr_find(&sctp_assocs_id, (int)id);
254         spin_unlock_bh(&sctp_assocs_id_lock);
255
256         if (!asoc || (asoc->base.sk != sk) || asoc->base.dead)
257                 return NULL;
258
259         return asoc;
260 }
261
262 /* Look up the transport from an address and an assoc id. If both address and
263  * id are specified, the associations matching the address and the id should be
264  * the same.
265  */
266 static struct sctp_transport *sctp_addr_id2transport(struct sock *sk,
267                                               struct sockaddr_storage *addr,
268                                               sctp_assoc_t id)
269 {
270         struct sctp_association *addr_asoc = NULL, *id_asoc = NULL;
271         struct sctp_af *af = sctp_get_af_specific(addr->ss_family);
272         union sctp_addr *laddr = (union sctp_addr *)addr;
273         struct sctp_transport *transport;
274
275         if (!af || sctp_verify_addr(sk, laddr, af->sockaddr_len))
276                 return NULL;
277
278         addr_asoc = sctp_endpoint_lookup_assoc(sctp_sk(sk)->ep,
279                                                laddr,
280                                                &transport);
281
282         if (!addr_asoc)
283                 return NULL;
284
285         id_asoc = sctp_id2assoc(sk, id);
286         if (id_asoc && (id_asoc != addr_asoc))
287                 return NULL;
288
289         sctp_get_pf_specific(sk->sk_family)->addr_to_user(sctp_sk(sk),
290                                                 (union sctp_addr *)addr);
291
292         return transport;
293 }
294
295 /* API 3.1.2 bind() - UDP Style Syntax
296  * The syntax of bind() is,
297  *
298  *   ret = bind(int sd, struct sockaddr *addr, int addrlen);
299  *
300  *   sd      - the socket descriptor returned by socket().
301  *   addr    - the address structure (struct sockaddr_in or struct
302  *             sockaddr_in6 [RFC 2553]),
303  *   addr_len - the size of the address structure.
304  */
305 static int sctp_bind(struct sock *sk, struct sockaddr *addr, int addr_len)
306 {
307         int retval = 0;
308
309         lock_sock(sk);
310
311         pr_debug("%s: sk:%p, addr:%p, addr_len:%d\n", __func__, sk,
312                  addr, addr_len);
313
314         /* Disallow binding twice. */
315         if (!sctp_sk(sk)->ep->base.bind_addr.port)
316                 retval = sctp_do_bind(sk, (union sctp_addr *)addr,
317                                       addr_len);
318         else
319                 retval = -EINVAL;
320
321         release_sock(sk);
322
323         return retval;
324 }
325
326 static long sctp_get_port_local(struct sock *, union sctp_addr *);
327
328 /* Verify this is a valid sockaddr. */
329 static struct sctp_af *sctp_sockaddr_af(struct sctp_sock *opt,
330                                         union sctp_addr *addr, int len)
331 {
332         struct sctp_af *af;
333
334         /* Check minimum size.  */
335         if (len < sizeof (struct sockaddr))
336                 return NULL;
337
338         /* V4 mapped address are really of AF_INET family */
339         if (addr->sa.sa_family == AF_INET6 &&
340             ipv6_addr_v4mapped(&addr->v6.sin6_addr)) {
341                 if (!opt->pf->af_supported(AF_INET, opt))
342                         return NULL;
343         } else {
344                 /* Does this PF support this AF? */
345                 if (!opt->pf->af_supported(addr->sa.sa_family, opt))
346                         return NULL;
347         }
348
349         /* If we get this far, af is valid. */
350         af = sctp_get_af_specific(addr->sa.sa_family);
351
352         if (len < af->sockaddr_len)
353                 return NULL;
354
355         return af;
356 }
357
358 /* Bind a local address either to an endpoint or to an association.  */
359 static int sctp_do_bind(struct sock *sk, union sctp_addr *addr, int len)
360 {
361         struct net *net = sock_net(sk);
362         struct sctp_sock *sp = sctp_sk(sk);
363         struct sctp_endpoint *ep = sp->ep;
364         struct sctp_bind_addr *bp = &ep->base.bind_addr;
365         struct sctp_af *af;
366         unsigned short snum;
367         int ret = 0;
368
369         /* Common sockaddr verification. */
370         af = sctp_sockaddr_af(sp, addr, len);
371         if (!af) {
372                 pr_debug("%s: sk:%p, newaddr:%p, len:%d EINVAL\n",
373                          __func__, sk, addr, len);
374                 return -EINVAL;
375         }
376
377         snum = ntohs(addr->v4.sin_port);
378
379         pr_debug("%s: sk:%p, new addr:%pISc, port:%d, new port:%d, len:%d\n",
380                  __func__, sk, &addr->sa, bp->port, snum, len);
381
382         /* PF specific bind() address verification. */
383         if (!sp->pf->bind_verify(sp, addr))
384                 return -EADDRNOTAVAIL;
385
386         /* We must either be unbound, or bind to the same port.
387          * It's OK to allow 0 ports if we are already bound.
388          * We'll just inhert an already bound port in this case
389          */
390         if (bp->port) {
391                 if (!snum)
392                         snum = bp->port;
393                 else if (snum != bp->port) {
394                         pr_debug("%s: new port %d doesn't match existing port "
395                                  "%d\n", __func__, snum, bp->port);
396                         return -EINVAL;
397                 }
398         }
399
400         if (snum && snum < inet_prot_sock(net) &&
401             !ns_capable(net->user_ns, CAP_NET_BIND_SERVICE))
402                 return -EACCES;
403
404         /* See if the address matches any of the addresses we may have
405          * already bound before checking against other endpoints.
406          */
407         if (sctp_bind_addr_match(bp, addr, sp))
408                 return -EINVAL;
409
410         /* Make sure we are allowed to bind here.
411          * The function sctp_get_port_local() does duplicate address
412          * detection.
413          */
414         addr->v4.sin_port = htons(snum);
415         if ((ret = sctp_get_port_local(sk, addr))) {
416                 return -EADDRINUSE;
417         }
418
419         /* Refresh ephemeral port.  */
420         if (!bp->port)
421                 bp->port = inet_sk(sk)->inet_num;
422
423         /* Add the address to the bind address list.
424          * Use GFP_ATOMIC since BHs will be disabled.
425          */
426         ret = sctp_add_bind_addr(bp, addr, af->sockaddr_len,
427                                  SCTP_ADDR_SRC, GFP_ATOMIC);
428
429         /* Copy back into socket for getsockname() use. */
430         if (!ret) {
431                 inet_sk(sk)->inet_sport = htons(inet_sk(sk)->inet_num);
432                 sp->pf->to_sk_saddr(addr, sk);
433         }
434
435         return ret;
436 }
437
438  /* ADDIP Section 4.1.1 Congestion Control of ASCONF Chunks
439  *
440  * R1) One and only one ASCONF Chunk MAY be in transit and unacknowledged
441  * at any one time.  If a sender, after sending an ASCONF chunk, decides
442  * it needs to transfer another ASCONF Chunk, it MUST wait until the
443  * ASCONF-ACK Chunk returns from the previous ASCONF Chunk before sending a
444  * subsequent ASCONF. Note this restriction binds each side, so at any
445  * time two ASCONF may be in-transit on any given association (one sent
446  * from each endpoint).
447  */
448 static int sctp_send_asconf(struct sctp_association *asoc,
449                             struct sctp_chunk *chunk)
450 {
451         struct net      *net = sock_net(asoc->base.sk);
452         int             retval = 0;
453
454         /* If there is an outstanding ASCONF chunk, queue it for later
455          * transmission.
456          */
457         if (asoc->addip_last_asconf) {
458                 list_add_tail(&chunk->list, &asoc->addip_chunk_list);
459                 goto out;
460         }
461
462         /* Hold the chunk until an ASCONF_ACK is received. */
463         sctp_chunk_hold(chunk);
464         retval = sctp_primitive_ASCONF(net, asoc, chunk);
465         if (retval)
466                 sctp_chunk_free(chunk);
467         else
468                 asoc->addip_last_asconf = chunk;
469
470 out:
471         return retval;
472 }
473
474 /* Add a list of addresses as bind addresses to local endpoint or
475  * association.
476  *
477  * Basically run through each address specified in the addrs/addrcnt
478  * array/length pair, determine if it is IPv6 or IPv4 and call
479  * sctp_do_bind() on it.
480  *
481  * If any of them fails, then the operation will be reversed and the
482  * ones that were added will be removed.
483  *
484  * Only sctp_setsockopt_bindx() is supposed to call this function.
485  */
486 static int sctp_bindx_add(struct sock *sk, struct sockaddr *addrs, int addrcnt)
487 {
488         int cnt;
489         int retval = 0;
490         void *addr_buf;
491         struct sockaddr *sa_addr;
492         struct sctp_af *af;
493
494         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n", __func__, sk,
495                  addrs, addrcnt);
496
497         addr_buf = addrs;
498         for (cnt = 0; cnt < addrcnt; cnt++) {
499                 /* The list may contain either IPv4 or IPv6 address;
500                  * determine the address length for walking thru the list.
501                  */
502                 sa_addr = addr_buf;
503                 af = sctp_get_af_specific(sa_addr->sa_family);
504                 if (!af) {
505                         retval = -EINVAL;
506                         goto err_bindx_add;
507                 }
508
509                 retval = sctp_do_bind(sk, (union sctp_addr *)sa_addr,
510                                       af->sockaddr_len);
511
512                 addr_buf += af->sockaddr_len;
513
514 err_bindx_add:
515                 if (retval < 0) {
516                         /* Failed. Cleanup the ones that have been added */
517                         if (cnt > 0)
518                                 sctp_bindx_rem(sk, addrs, cnt);
519                         return retval;
520                 }
521         }
522
523         return retval;
524 }
525
526 /* Send an ASCONF chunk with Add IP address parameters to all the peers of the
527  * associations that are part of the endpoint indicating that a list of local
528  * addresses are added to the endpoint.
529  *
530  * If any of the addresses is already in the bind address list of the
531  * association, we do not send the chunk for that association.  But it will not
532  * affect other associations.
533  *
534  * Only sctp_setsockopt_bindx() is supposed to call this function.
535  */
536 static int sctp_send_asconf_add_ip(struct sock          *sk,
537                                    struct sockaddr      *addrs,
538                                    int                  addrcnt)
539 {
540         struct net *net = sock_net(sk);
541         struct sctp_sock                *sp;
542         struct sctp_endpoint            *ep;
543         struct sctp_association         *asoc;
544         struct sctp_bind_addr           *bp;
545         struct sctp_chunk               *chunk;
546         struct sctp_sockaddr_entry      *laddr;
547         union sctp_addr                 *addr;
548         union sctp_addr                 saveaddr;
549         void                            *addr_buf;
550         struct sctp_af                  *af;
551         struct list_head                *p;
552         int                             i;
553         int                             retval = 0;
554
555         if (!net->sctp.addip_enable)
556                 return retval;
557
558         sp = sctp_sk(sk);
559         ep = sp->ep;
560
561         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n",
562                  __func__, sk, addrs, addrcnt);
563
564         list_for_each_entry(asoc, &ep->asocs, asocs) {
565                 if (!asoc->peer.asconf_capable)
566                         continue;
567
568                 if (asoc->peer.addip_disabled_mask & SCTP_PARAM_ADD_IP)
569                         continue;
570
571                 if (!sctp_state(asoc, ESTABLISHED))
572                         continue;
573
574                 /* Check if any address in the packed array of addresses is
575                  * in the bind address list of the association. If so,
576                  * do not send the asconf chunk to its peer, but continue with
577                  * other associations.
578                  */
579                 addr_buf = addrs;
580                 for (i = 0; i < addrcnt; i++) {
581                         addr = addr_buf;
582                         af = sctp_get_af_specific(addr->v4.sin_family);
583                         if (!af) {
584                                 retval = -EINVAL;
585                                 goto out;
586                         }
587
588                         if (sctp_assoc_lookup_laddr(asoc, addr))
589                                 break;
590
591                         addr_buf += af->sockaddr_len;
592                 }
593                 if (i < addrcnt)
594                         continue;
595
596                 /* Use the first valid address in bind addr list of
597                  * association as Address Parameter of ASCONF CHUNK.
598                  */
599                 bp = &asoc->base.bind_addr;
600                 p = bp->address_list.next;
601                 laddr = list_entry(p, struct sctp_sockaddr_entry, list);
602                 chunk = sctp_make_asconf_update_ip(asoc, &laddr->a, addrs,
603                                                    addrcnt, SCTP_PARAM_ADD_IP);
604                 if (!chunk) {
605                         retval = -ENOMEM;
606                         goto out;
607                 }
608
609                 /* Add the new addresses to the bind address list with
610                  * use_as_src set to 0.
611                  */
612                 addr_buf = addrs;
613                 for (i = 0; i < addrcnt; i++) {
614                         addr = addr_buf;
615                         af = sctp_get_af_specific(addr->v4.sin_family);
616                         memcpy(&saveaddr, addr, af->sockaddr_len);
617                         retval = sctp_add_bind_addr(bp, &saveaddr,
618                                                     sizeof(saveaddr),
619                                                     SCTP_ADDR_NEW, GFP_ATOMIC);
620                         addr_buf += af->sockaddr_len;
621                 }
622                 if (asoc->src_out_of_asoc_ok) {
623                         struct sctp_transport *trans;
624
625                         list_for_each_entry(trans,
626                             &asoc->peer.transport_addr_list, transports) {
627                                 /* Clear the source and route cache */
628                                 sctp_transport_dst_release(trans);
629                                 trans->cwnd = min(4*asoc->pathmtu, max_t(__u32,
630                                     2*asoc->pathmtu, 4380));
631                                 trans->ssthresh = asoc->peer.i.a_rwnd;
632                                 trans->rto = asoc->rto_initial;
633                                 sctp_max_rto(asoc, trans);
634                                 trans->rtt = trans->srtt = trans->rttvar = 0;
635                                 sctp_transport_route(trans, NULL,
636                                     sctp_sk(asoc->base.sk));
637                         }
638                 }
639                 retval = sctp_send_asconf(asoc, chunk);
640         }
641
642 out:
643         return retval;
644 }
645
646 /* Remove a list of addresses from bind addresses list.  Do not remove the
647  * last address.
648  *
649  * Basically run through each address specified in the addrs/addrcnt
650  * array/length pair, determine if it is IPv6 or IPv4 and call
651  * sctp_del_bind() on it.
652  *
653  * If any of them fails, then the operation will be reversed and the
654  * ones that were removed will be added back.
655  *
656  * At least one address has to be left; if only one address is
657  * available, the operation will return -EBUSY.
658  *
659  * Only sctp_setsockopt_bindx() is supposed to call this function.
660  */
661 static int sctp_bindx_rem(struct sock *sk, struct sockaddr *addrs, int addrcnt)
662 {
663         struct sctp_sock *sp = sctp_sk(sk);
664         struct sctp_endpoint *ep = sp->ep;
665         int cnt;
666         struct sctp_bind_addr *bp = &ep->base.bind_addr;
667         int retval = 0;
668         void *addr_buf;
669         union sctp_addr *sa_addr;
670         struct sctp_af *af;
671
672         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n",
673                  __func__, sk, addrs, addrcnt);
674
675         addr_buf = addrs;
676         for (cnt = 0; cnt < addrcnt; cnt++) {
677                 /* If the bind address list is empty or if there is only one
678                  * bind address, there is nothing more to be removed (we need
679                  * at least one address here).
680                  */
681                 if (list_empty(&bp->address_list) ||
682                     (sctp_list_single_entry(&bp->address_list))) {
683                         retval = -EBUSY;
684                         goto err_bindx_rem;
685                 }
686
687                 sa_addr = addr_buf;
688                 af = sctp_get_af_specific(sa_addr->sa.sa_family);
689                 if (!af) {
690                         retval = -EINVAL;
691                         goto err_bindx_rem;
692                 }
693
694                 if (!af->addr_valid(sa_addr, sp, NULL)) {
695                         retval = -EADDRNOTAVAIL;
696                         goto err_bindx_rem;
697                 }
698
699                 if (sa_addr->v4.sin_port &&
700                     sa_addr->v4.sin_port != htons(bp->port)) {
701                         retval = -EINVAL;
702                         goto err_bindx_rem;
703                 }
704
705                 if (!sa_addr->v4.sin_port)
706                         sa_addr->v4.sin_port = htons(bp->port);
707
708                 /* FIXME - There is probably a need to check if sk->sk_saddr and
709                  * sk->sk_rcv_addr are currently set to one of the addresses to
710                  * be removed. This is something which needs to be looked into
711                  * when we are fixing the outstanding issues with multi-homing
712                  * socket routing and failover schemes. Refer to comments in
713                  * sctp_do_bind(). -daisy
714                  */
715                 retval = sctp_del_bind_addr(bp, sa_addr);
716
717                 addr_buf += af->sockaddr_len;
718 err_bindx_rem:
719                 if (retval < 0) {
720                         /* Failed. Add the ones that has been removed back */
721                         if (cnt > 0)
722                                 sctp_bindx_add(sk, addrs, cnt);
723                         return retval;
724                 }
725         }
726
727         return retval;
728 }
729
730 /* Send an ASCONF chunk with Delete IP address parameters to all the peers of
731  * the associations that are part of the endpoint indicating that a list of
732  * local addresses are removed from the endpoint.
733  *
734  * If any of the addresses is already in the bind address list of the
735  * association, we do not send the chunk for that association.  But it will not
736  * affect other associations.
737  *
738  * Only sctp_setsockopt_bindx() is supposed to call this function.
739  */
740 static int sctp_send_asconf_del_ip(struct sock          *sk,
741                                    struct sockaddr      *addrs,
742                                    int                  addrcnt)
743 {
744         struct net *net = sock_net(sk);
745         struct sctp_sock        *sp;
746         struct sctp_endpoint    *ep;
747         struct sctp_association *asoc;
748         struct sctp_transport   *transport;
749         struct sctp_bind_addr   *bp;
750         struct sctp_chunk       *chunk;
751         union sctp_addr         *laddr;
752         void                    *addr_buf;
753         struct sctp_af          *af;
754         struct sctp_sockaddr_entry *saddr;
755         int                     i;
756         int                     retval = 0;
757         int                     stored = 0;
758
759         chunk = NULL;
760         if (!net->sctp.addip_enable)
761                 return retval;
762
763         sp = sctp_sk(sk);
764         ep = sp->ep;
765
766         pr_debug("%s: sk:%p, addrs:%p, addrcnt:%d\n",
767                  __func__, sk, addrs, addrcnt);
768
769         list_for_each_entry(asoc, &ep->asocs, asocs) {
770
771                 if (!asoc->peer.asconf_capable)
772                         continue;
773
774                 if (asoc->peer.addip_disabled_mask & SCTP_PARAM_DEL_IP)
775                         continue;
776
777                 if (!sctp_state(asoc, ESTABLISHED))
778                         continue;
779
780                 /* Check if any address in the packed array of addresses is
781                  * not present in the bind address list of the association.
782                  * If so, do not send the asconf chunk to its peer, but
783                  * continue with other associations.
784                  */
785                 addr_buf = addrs;
786                 for (i = 0; i < addrcnt; i++) {
787                         laddr = addr_buf;
788                         af = sctp_get_af_specific(laddr->v4.sin_family);
789                         if (!af) {
790                                 retval = -EINVAL;
791                                 goto out;
792                         }
793
794                         if (!sctp_assoc_lookup_laddr(asoc, laddr))
795                                 break;
796
797                         addr_buf += af->sockaddr_len;
798                 }
799                 if (i < addrcnt)
800                         continue;
801
802                 /* Find one address in the association's bind address list
803                  * that is not in the packed array of addresses. This is to
804                  * make sure that we do not delete all the addresses in the
805                  * association.
806                  */
807                 bp = &asoc->base.bind_addr;
808                 laddr = sctp_find_unmatch_addr(bp, (union sctp_addr *)addrs,
809                                                addrcnt, sp);
810                 if ((laddr == NULL) && (addrcnt == 1)) {
811                         if (asoc->asconf_addr_del_pending)
812                                 continue;
813                         asoc->asconf_addr_del_pending =
814                             kzalloc(sizeof(union sctp_addr), GFP_ATOMIC);
815                         if (asoc->asconf_addr_del_pending == NULL) {
816                                 retval = -ENOMEM;
817                                 goto out;
818                         }
819                         asoc->asconf_addr_del_pending->sa.sa_family =
820                                     addrs->sa_family;
821                         asoc->asconf_addr_del_pending->v4.sin_port =
822                                     htons(bp->port);
823                         if (addrs->sa_family == AF_INET) {
824                                 struct sockaddr_in *sin;
825
826                                 sin = (struct sockaddr_in *)addrs;
827                                 asoc->asconf_addr_del_pending->v4.sin_addr.s_addr = sin->sin_addr.s_addr;
828                         } else if (addrs->sa_family == AF_INET6) {
829                                 struct sockaddr_in6 *sin6;
830
831                                 sin6 = (struct sockaddr_in6 *)addrs;
832                                 asoc->asconf_addr_del_pending->v6.sin6_addr = sin6->sin6_addr;
833                         }
834
835                         pr_debug("%s: keep the last address asoc:%p %pISc at %p\n",
836                                  __func__, asoc, &asoc->asconf_addr_del_pending->sa,
837                                  asoc->asconf_addr_del_pending);
838
839                         asoc->src_out_of_asoc_ok = 1;
840                         stored = 1;
841                         goto skip_mkasconf;
842                 }
843
844                 if (laddr == NULL)
845                         return -EINVAL;
846
847                 /* We do not need RCU protection throughout this loop
848                  * because this is done under a socket lock from the
849                  * setsockopt call.
850                  */
851                 chunk = sctp_make_asconf_update_ip(asoc, laddr, addrs, addrcnt,
852                                                    SCTP_PARAM_DEL_IP);
853                 if (!chunk) {
854                         retval = -ENOMEM;
855                         goto out;
856                 }
857
858 skip_mkasconf:
859                 /* Reset use_as_src flag for the addresses in the bind address
860                  * list that are to be deleted.
861                  */
862                 addr_buf = addrs;
863                 for (i = 0; i < addrcnt; i++) {
864                         laddr = addr_buf;
865                         af = sctp_get_af_specific(laddr->v4.sin_family);
866                         list_for_each_entry(saddr, &bp->address_list, list) {
867                                 if (sctp_cmp_addr_exact(&saddr->a, laddr))
868                                         saddr->state = SCTP_ADDR_DEL;
869                         }
870                         addr_buf += af->sockaddr_len;
871                 }
872
873                 /* Update the route and saddr entries for all the transports
874                  * as some of the addresses in the bind address list are
875                  * about to be deleted and cannot be used as source addresses.
876                  */
877                 list_for_each_entry(transport, &asoc->peer.transport_addr_list,
878                                         transports) {
879                         sctp_transport_dst_release(transport);
880                         sctp_transport_route(transport, NULL,
881                                              sctp_sk(asoc->base.sk));
882                 }
883
884                 if (stored)
885                         /* We don't need to transmit ASCONF */
886                         continue;
887                 retval = sctp_send_asconf(asoc, chunk);
888         }
889 out:
890         return retval;
891 }
892
893 /* set addr events to assocs in the endpoint.  ep and addr_wq must be locked */
894 int sctp_asconf_mgmt(struct sctp_sock *sp, struct sctp_sockaddr_entry *addrw)
895 {
896         struct sock *sk = sctp_opt2sk(sp);
897         union sctp_addr *addr;
898         struct sctp_af *af;
899
900         /* It is safe to write port space in caller. */
901         addr = &addrw->a;
902         addr->v4.sin_port = htons(sp->ep->base.bind_addr.port);
903         af = sctp_get_af_specific(addr->sa.sa_family);
904         if (!af)
905                 return -EINVAL;
906         if (sctp_verify_addr(sk, addr, af->sockaddr_len))
907                 return -EINVAL;
908
909         if (addrw->state == SCTP_ADDR_NEW)
910                 return sctp_send_asconf_add_ip(sk, (struct sockaddr *)addr, 1);
911         else
912                 return sctp_send_asconf_del_ip(sk, (struct sockaddr *)addr, 1);
913 }
914
915 /* Helper for tunneling sctp_bindx() requests through sctp_setsockopt()
916  *
917  * API 8.1
918  * int sctp_bindx(int sd, struct sockaddr *addrs, int addrcnt,
919  *                int flags);
920  *
921  * If sd is an IPv4 socket, the addresses passed must be IPv4 addresses.
922  * If the sd is an IPv6 socket, the addresses passed can either be IPv4
923  * or IPv6 addresses.
924  *
925  * A single address may be specified as INADDR_ANY or IN6ADDR_ANY, see
926  * Section 3.1.2 for this usage.
927  *
928  * addrs is a pointer to an array of one or more socket addresses. Each
929  * address is contained in its appropriate structure (i.e. struct
930  * sockaddr_in or struct sockaddr_in6) the family of the address type
931  * must be used to distinguish the address length (note that this
932  * representation is termed a "packed array" of addresses). The caller
933  * specifies the number of addresses in the array with addrcnt.
934  *
935  * On success, sctp_bindx() returns 0. On failure, sctp_bindx() returns
936  * -1, and sets errno to the appropriate error code.
937  *
938  * For SCTP, the port given in each socket address must be the same, or
939  * sctp_bindx() will fail, setting errno to EINVAL.
940  *
941  * The flags parameter is formed from the bitwise OR of zero or more of
942  * the following currently defined flags:
943  *
944  * SCTP_BINDX_ADD_ADDR
945  *
946  * SCTP_BINDX_REM_ADDR
947  *
948  * SCTP_BINDX_ADD_ADDR directs SCTP to add the given addresses to the
949  * association, and SCTP_BINDX_REM_ADDR directs SCTP to remove the given
950  * addresses from the association. The two flags are mutually exclusive;
951  * if both are given, sctp_bindx() will fail with EINVAL. A caller may
952  * not remove all addresses from an association; sctp_bindx() will
953  * reject such an attempt with EINVAL.
954  *
955  * An application can use sctp_bindx(SCTP_BINDX_ADD_ADDR) to associate
956  * additional addresses with an endpoint after calling bind().  Or use
957  * sctp_bindx(SCTP_BINDX_REM_ADDR) to remove some addresses a listening
958  * socket is associated with so that no new association accepted will be
959  * associated with those addresses. If the endpoint supports dynamic
960  * address a SCTP_BINDX_REM_ADDR or SCTP_BINDX_ADD_ADDR may cause a
961  * endpoint to send the appropriate message to the peer to change the
962  * peers address lists.
963  *
964  * Adding and removing addresses from a connected association is
965  * optional functionality. Implementations that do not support this
966  * functionality should return EOPNOTSUPP.
967  *
968  * Basically do nothing but copying the addresses from user to kernel
969  * land and invoking either sctp_bindx_add() or sctp_bindx_rem() on the sk.
970  * This is used for tunneling the sctp_bindx() request through sctp_setsockopt()
971  * from userspace.
972  *
973  * We don't use copy_from_user() for optimization: we first do the
974  * sanity checks (buffer size -fast- and access check-healthy
975  * pointer); if all of those succeed, then we can alloc the memory
976  * (expensive operation) needed to copy the data to kernel. Then we do
977  * the copying without checking the user space area
978  * (__copy_from_user()).
979  *
980  * On exit there is no need to do sockfd_put(), sys_setsockopt() does
981  * it.
982  *
983  * sk        The sk of the socket
984  * addrs     The pointer to the addresses in user land
985  * addrssize Size of the addrs buffer
986  * op        Operation to perform (add or remove, see the flags of
987  *           sctp_bindx)
988  *
989  * Returns 0 if ok, <0 errno code on error.
990  */
991 static int sctp_setsockopt_bindx(struct sock *sk,
992                                  struct sockaddr __user *addrs,
993                                  int addrs_size, int op)
994 {
995         struct sockaddr *kaddrs;
996         int err;
997         int addrcnt = 0;
998         int walk_size = 0;
999         struct sockaddr *sa_addr;
1000         void *addr_buf;
1001         struct sctp_af *af;
1002
1003         pr_debug("%s: sk:%p addrs:%p addrs_size:%d opt:%d\n",
1004                  __func__, sk, addrs, addrs_size, op);
1005
1006         if (unlikely(addrs_size <= 0))
1007                 return -EINVAL;
1008
1009         /* Check the user passed a healthy pointer.  */
1010         if (unlikely(!access_ok(VERIFY_READ, addrs, addrs_size)))
1011                 return -EFAULT;
1012
1013         /* Alloc space for the address array in kernel memory.  */
1014         kaddrs = kmalloc(addrs_size, GFP_USER | __GFP_NOWARN);
1015         if (unlikely(!kaddrs))
1016                 return -ENOMEM;
1017
1018         if (__copy_from_user(kaddrs, addrs, addrs_size)) {
1019                 kfree(kaddrs);
1020                 return -EFAULT;
1021         }
1022
1023         /* Walk through the addrs buffer and count the number of addresses. */
1024         addr_buf = kaddrs;
1025         while (walk_size < addrs_size) {
1026                 if (walk_size + sizeof(sa_family_t) > addrs_size) {
1027                         kfree(kaddrs);
1028                         return -EINVAL;
1029                 }
1030
1031                 sa_addr = addr_buf;
1032                 af = sctp_get_af_specific(sa_addr->sa_family);
1033
1034                 /* If the address family is not supported or if this address
1035                  * causes the address buffer to overflow return EINVAL.
1036                  */
1037                 if (!af || (walk_size + af->sockaddr_len) > addrs_size) {
1038                         kfree(kaddrs);
1039                         return -EINVAL;
1040                 }
1041                 addrcnt++;
1042                 addr_buf += af->sockaddr_len;
1043                 walk_size += af->sockaddr_len;
1044         }
1045
1046         /* Do the work. */
1047         switch (op) {
1048         case SCTP_BINDX_ADD_ADDR:
1049                 err = sctp_bindx_add(sk, kaddrs, addrcnt);
1050                 if (err)
1051                         goto out;
1052                 err = sctp_send_asconf_add_ip(sk, kaddrs, addrcnt);
1053                 break;
1054
1055         case SCTP_BINDX_REM_ADDR:
1056                 err = sctp_bindx_rem(sk, kaddrs, addrcnt);
1057                 if (err)
1058                         goto out;
1059                 err = sctp_send_asconf_del_ip(sk, kaddrs, addrcnt);
1060                 break;
1061
1062         default:
1063                 err = -EINVAL;
1064                 break;
1065         }
1066
1067 out:
1068         kfree(kaddrs);
1069
1070         return err;
1071 }
1072
1073 /* __sctp_connect(struct sock* sk, struct sockaddr *kaddrs, int addrs_size)
1074  *
1075  * Common routine for handling connect() and sctp_connectx().
1076  * Connect will come in with just a single address.
1077  */
1078 static int __sctp_connect(struct sock *sk,
1079                           struct sockaddr *kaddrs,
1080                           int addrs_size,
1081                           sctp_assoc_t *assoc_id)
1082 {
1083         struct net *net = sock_net(sk);
1084         struct sctp_sock *sp;
1085         struct sctp_endpoint *ep;
1086         struct sctp_association *asoc = NULL;
1087         struct sctp_association *asoc2;
1088         struct sctp_transport *transport;
1089         union sctp_addr to;
1090         enum sctp_scope scope;
1091         long timeo;
1092         int err = 0;
1093         int addrcnt = 0;
1094         int walk_size = 0;
1095         union sctp_addr *sa_addr = NULL;
1096         void *addr_buf;
1097         unsigned short port;
1098         unsigned int f_flags = 0;
1099
1100         sp = sctp_sk(sk);
1101         ep = sp->ep;
1102
1103         /* connect() cannot be done on a socket that is already in ESTABLISHED
1104          * state - UDP-style peeled off socket or a TCP-style socket that
1105          * is already connected.
1106          * It cannot be done even on a TCP-style listening socket.
1107          */
1108         if (sctp_sstate(sk, ESTABLISHED) || sctp_sstate(sk, CLOSING) ||
1109             (sctp_style(sk, TCP) && sctp_sstate(sk, LISTENING))) {
1110                 err = -EISCONN;
1111                 goto out_free;
1112         }
1113
1114         /* Walk through the addrs buffer and count the number of addresses. */
1115         addr_buf = kaddrs;
1116         while (walk_size < addrs_size) {
1117                 struct sctp_af *af;
1118
1119                 if (walk_size + sizeof(sa_family_t) > addrs_size) {
1120                         err = -EINVAL;
1121                         goto out_free;
1122                 }
1123
1124                 sa_addr = addr_buf;
1125                 af = sctp_get_af_specific(sa_addr->sa.sa_family);
1126
1127                 /* If the address family is not supported or if this address
1128                  * causes the address buffer to overflow return EINVAL.
1129                  */
1130                 if (!af || (walk_size + af->sockaddr_len) > addrs_size) {
1131                         err = -EINVAL;
1132                         goto out_free;
1133                 }
1134
1135                 port = ntohs(sa_addr->v4.sin_port);
1136
1137                 /* Save current address so we can work with it */
1138                 memcpy(&to, sa_addr, af->sockaddr_len);
1139
1140                 err = sctp_verify_addr(sk, &to, af->sockaddr_len);
1141                 if (err)
1142                         goto out_free;
1143
1144                 /* Make sure the destination port is correctly set
1145                  * in all addresses.
1146                  */
1147                 if (asoc && asoc->peer.port && asoc->peer.port != port) {
1148                         err = -EINVAL;
1149                         goto out_free;
1150                 }
1151
1152                 /* Check if there already is a matching association on the
1153                  * endpoint (other than the one created here).
1154                  */
1155                 asoc2 = sctp_endpoint_lookup_assoc(ep, &to, &transport);
1156                 if (asoc2 && asoc2 != asoc) {
1157                         if (asoc2->state >= SCTP_STATE_ESTABLISHED)
1158                                 err = -EISCONN;
1159                         else
1160                                 err = -EALREADY;
1161                         goto out_free;
1162                 }
1163
1164                 /* If we could not find a matching association on the endpoint,
1165                  * make sure that there is no peeled-off association matching
1166                  * the peer address even on another socket.
1167                  */
1168                 if (sctp_endpoint_is_peeled_off(ep, &to)) {
1169                         err = -EADDRNOTAVAIL;
1170                         goto out_free;
1171                 }
1172
1173                 if (!asoc) {
1174                         /* If a bind() or sctp_bindx() is not called prior to
1175                          * an sctp_connectx() call, the system picks an
1176                          * ephemeral port and will choose an address set
1177                          * equivalent to binding with a wildcard address.
1178                          */
1179                         if (!ep->base.bind_addr.port) {
1180                                 if (sctp_autobind(sk)) {
1181                                         err = -EAGAIN;
1182                                         goto out_free;
1183                                 }
1184                         } else {
1185                                 /*
1186                                  * If an unprivileged user inherits a 1-many
1187                                  * style socket with open associations on a
1188                                  * privileged port, it MAY be permitted to
1189                                  * accept new associations, but it SHOULD NOT
1190                                  * be permitted to open new associations.
1191                                  */
1192                                 if (ep->base.bind_addr.port <
1193                                     inet_prot_sock(net) &&
1194                                     !ns_capable(net->user_ns,
1195                                     CAP_NET_BIND_SERVICE)) {
1196                                         err = -EACCES;
1197                                         goto out_free;
1198                                 }
1199                         }
1200
1201                         scope = sctp_scope(&to);
1202                         asoc = sctp_association_new(ep, sk, scope, GFP_KERNEL);
1203                         if (!asoc) {
1204                                 err = -ENOMEM;
1205                                 goto out_free;
1206                         }
1207
1208                         err = sctp_assoc_set_bind_addr_from_ep(asoc, scope,
1209                                                               GFP_KERNEL);
1210                         if (err < 0) {
1211                                 goto out_free;
1212                         }
1213
1214                 }
1215
1216                 /* Prime the peer's transport structures.  */
1217                 transport = sctp_assoc_add_peer(asoc, &to, GFP_KERNEL,
1218                                                 SCTP_UNKNOWN);
1219                 if (!transport) {
1220                         err = -ENOMEM;
1221                         goto out_free;
1222                 }
1223
1224                 addrcnt++;
1225                 addr_buf += af->sockaddr_len;
1226                 walk_size += af->sockaddr_len;
1227         }
1228
1229         /* In case the user of sctp_connectx() wants an association
1230          * id back, assign one now.
1231          */
1232         if (assoc_id) {
1233                 err = sctp_assoc_set_id(asoc, GFP_KERNEL);
1234                 if (err < 0)
1235                         goto out_free;
1236         }
1237
1238         err = sctp_primitive_ASSOCIATE(net, asoc, NULL);
1239         if (err < 0) {
1240                 goto out_free;
1241         }
1242
1243         /* Initialize sk's dport and daddr for getpeername() */
1244         inet_sk(sk)->inet_dport = htons(asoc->peer.port);
1245         sp->pf->to_sk_daddr(sa_addr, sk);
1246         sk->sk_err = 0;
1247
1248         /* in-kernel sockets don't generally have a file allocated to them
1249          * if all they do is call sock_create_kern().
1250          */
1251         if (sk->sk_socket->file)
1252                 f_flags = sk->sk_socket->file->f_flags;
1253
1254         timeo = sock_sndtimeo(sk, f_flags & O_NONBLOCK);
1255
1256         if (assoc_id)
1257                 *assoc_id = asoc->assoc_id;
1258         err = sctp_wait_for_connect(asoc, &timeo);
1259         /* Note: the asoc may be freed after the return of
1260          * sctp_wait_for_connect.
1261          */
1262
1263         /* Don't free association on exit. */
1264         asoc = NULL;
1265
1266 out_free:
1267         pr_debug("%s: took out_free path with asoc:%p kaddrs:%p err:%d\n",
1268                  __func__, asoc, kaddrs, err);
1269
1270         if (asoc) {
1271                 /* sctp_primitive_ASSOCIATE may have added this association
1272                  * To the hash table, try to unhash it, just in case, its a noop
1273                  * if it wasn't hashed so we're safe
1274                  */
1275                 sctp_association_free(asoc);
1276         }
1277         return err;
1278 }
1279
1280 /* Helper for tunneling sctp_connectx() requests through sctp_setsockopt()
1281  *
1282  * API 8.9
1283  * int sctp_connectx(int sd, struct sockaddr *addrs, int addrcnt,
1284  *                      sctp_assoc_t *asoc);
1285  *
1286  * If sd is an IPv4 socket, the addresses passed must be IPv4 addresses.
1287  * If the sd is an IPv6 socket, the addresses passed can either be IPv4
1288  * or IPv6 addresses.
1289  *
1290  * A single address may be specified as INADDR_ANY or IN6ADDR_ANY, see
1291  * Section 3.1.2 for this usage.
1292  *
1293  * addrs is a pointer to an array of one or more socket addresses. Each
1294  * address is contained in its appropriate structure (i.e. struct
1295  * sockaddr_in or struct sockaddr_in6) the family of the address type
1296  * must be used to distengish the address length (note that this
1297  * representation is termed a "packed array" of addresses). The caller
1298  * specifies the number of addresses in the array with addrcnt.
1299  *
1300  * On success, sctp_connectx() returns 0. It also sets the assoc_id to
1301  * the association id of the new association.  On failure, sctp_connectx()
1302  * returns -1, and sets errno to the appropriate error code.  The assoc_id
1303  * is not touched by the kernel.
1304  *
1305  * For SCTP, the port given in each socket address must be the same, or
1306  * sctp_connectx() will fail, setting errno to EINVAL.
1307  *
1308  * An application can use sctp_connectx to initiate an association with
1309  * an endpoint that is multi-homed.  Much like sctp_bindx() this call
1310  * allows a caller to specify multiple addresses at which a peer can be
1311  * reached.  The way the SCTP stack uses the list of addresses to set up
1312  * the association is implementation dependent.  This function only
1313  * specifies that the stack will try to make use of all the addresses in
1314  * the list when needed.
1315  *
1316  * Note that the list of addresses passed in is only used for setting up
1317  * the association.  It does not necessarily equal the set of addresses
1318  * the peer uses for the resulting association.  If the caller wants to
1319  * find out the set of peer addresses, it must use sctp_getpaddrs() to
1320  * retrieve them after the association has been set up.
1321  *
1322  * Basically do nothing but copying the addresses from user to kernel
1323  * land and invoking either sctp_connectx(). This is used for tunneling
1324  * the sctp_connectx() request through sctp_setsockopt() from userspace.
1325  *
1326  * We don't use copy_from_user() for optimization: we first do the
1327  * sanity checks (buffer size -fast- and access check-healthy
1328  * pointer); if all of those succeed, then we can alloc the memory
1329  * (expensive operation) needed to copy the data to kernel. Then we do
1330  * the copying without checking the user space area
1331  * (__copy_from_user()).
1332  *
1333  * On exit there is no need to do sockfd_put(), sys_setsockopt() does
1334  * it.
1335  *
1336  * sk        The sk of the socket
1337  * addrs     The pointer to the addresses in user land
1338  * addrssize Size of the addrs buffer
1339  *
1340  * Returns >=0 if ok, <0 errno code on error.
1341  */
1342 static int __sctp_setsockopt_connectx(struct sock *sk,
1343                                       struct sockaddr __user *addrs,
1344                                       int addrs_size,
1345                                       sctp_assoc_t *assoc_id)
1346 {
1347         struct sockaddr *kaddrs;
1348         gfp_t gfp = GFP_KERNEL;
1349         int err = 0;
1350
1351         pr_debug("%s: sk:%p addrs:%p addrs_size:%d\n",
1352                  __func__, sk, addrs, addrs_size);
1353
1354         if (unlikely(addrs_size <= 0))
1355                 return -EINVAL;
1356
1357         /* Check the user passed a healthy pointer.  */
1358         if (unlikely(!access_ok(VERIFY_READ, addrs, addrs_size)))
1359                 return -EFAULT;
1360
1361         /* Alloc space for the address array in kernel memory.  */
1362         if (sk->sk_socket->file)
1363                 gfp = GFP_USER | __GFP_NOWARN;
1364         kaddrs = kmalloc(addrs_size, gfp);
1365         if (unlikely(!kaddrs))
1366                 return -ENOMEM;
1367
1368         if (__copy_from_user(kaddrs, addrs, addrs_size)) {
1369                 err = -EFAULT;
1370         } else {
1371                 err = __sctp_connect(sk, kaddrs, addrs_size, assoc_id);
1372         }
1373
1374         kfree(kaddrs);
1375
1376         return err;
1377 }
1378
1379 /*
1380  * This is an older interface.  It's kept for backward compatibility
1381  * to the option that doesn't provide association id.
1382  */
1383 static int sctp_setsockopt_connectx_old(struct sock *sk,
1384                                         struct sockaddr __user *addrs,
1385                                         int addrs_size)
1386 {
1387         return __sctp_setsockopt_connectx(sk, addrs, addrs_size, NULL);
1388 }
1389
1390 /*
1391  * New interface for the API.  The since the API is done with a socket
1392  * option, to make it simple we feed back the association id is as a return
1393  * indication to the call.  Error is always negative and association id is
1394  * always positive.
1395  */
1396 static int sctp_setsockopt_connectx(struct sock *sk,
1397                                     struct sockaddr __user *addrs,
1398                                     int addrs_size)
1399 {
1400         sctp_assoc_t assoc_id = 0;
1401         int err = 0;
1402
1403         err = __sctp_setsockopt_connectx(sk, addrs, addrs_size, &assoc_id);
1404
1405         if (err)
1406                 return err;
1407         else
1408                 return assoc_id;
1409 }
1410
1411 /*
1412  * New (hopefully final) interface for the API.
1413  * We use the sctp_getaddrs_old structure so that use-space library
1414  * can avoid any unnecessary allocations. The only different part
1415  * is that we store the actual length of the address buffer into the
1416  * addrs_num structure member. That way we can re-use the existing
1417  * code.
1418  */
1419 #ifdef CONFIG_COMPAT
1420 struct compat_sctp_getaddrs_old {
1421         sctp_assoc_t    assoc_id;
1422         s32             addr_num;
1423         compat_uptr_t   addrs;          /* struct sockaddr * */
1424 };
1425 #endif
1426
1427 static int sctp_getsockopt_connectx3(struct sock *sk, int len,
1428                                      char __user *optval,
1429                                      int __user *optlen)
1430 {
1431         struct sctp_getaddrs_old param;
1432         sctp_assoc_t assoc_id = 0;
1433         int err = 0;
1434
1435 #ifdef CONFIG_COMPAT
1436         if (in_compat_syscall()) {
1437                 struct compat_sctp_getaddrs_old param32;
1438
1439                 if (len < sizeof(param32))
1440                         return -EINVAL;
1441                 if (copy_from_user(&param32, optval, sizeof(param32)))
1442                         return -EFAULT;
1443
1444                 param.assoc_id = param32.assoc_id;
1445                 param.addr_num = param32.addr_num;
1446                 param.addrs = compat_ptr(param32.addrs);
1447         } else
1448 #endif
1449         {
1450                 if (len < sizeof(param))
1451                         return -EINVAL;
1452                 if (copy_from_user(&param, optval, sizeof(param)))
1453                         return -EFAULT;
1454         }
1455
1456         err = __sctp_setsockopt_connectx(sk, (struct sockaddr __user *)
1457                                          param.addrs, param.addr_num,
1458                                          &assoc_id);
1459         if (err == 0 || err == -EINPROGRESS) {
1460                 if (copy_to_user(optval, &assoc_id, sizeof(assoc_id)))
1461                         return -EFAULT;
1462                 if (put_user(sizeof(assoc_id), optlen))
1463                         return -EFAULT;
1464         }
1465
1466         return err;
1467 }
1468
1469 /* API 3.1.4 close() - UDP Style Syntax
1470  * Applications use close() to perform graceful shutdown (as described in
1471  * Section 10.1 of [SCTP]) on ALL the associations currently represented
1472  * by a UDP-style socket.
1473  *
1474  * The syntax is
1475  *
1476  *   ret = close(int sd);
1477  *
1478  *   sd      - the socket descriptor of the associations to be closed.
1479  *
1480  * To gracefully shutdown a specific association represented by the
1481  * UDP-style socket, an application should use the sendmsg() call,
1482  * passing no user data, but including the appropriate flag in the
1483  * ancillary data (see Section xxxx).
1484  *
1485  * If sd in the close() call is a branched-off socket representing only
1486  * one association, the shutdown is performed on that association only.
1487  *
1488  * 4.1.6 close() - TCP Style Syntax
1489  *
1490  * Applications use close() to gracefully close down an association.
1491  *
1492  * The syntax is:
1493  *
1494  *    int close(int sd);
1495  *
1496  *      sd      - the socket descriptor of the association to be closed.
1497  *
1498  * After an application calls close() on a socket descriptor, no further
1499  * socket operations will succeed on that descriptor.
1500  *
1501  * API 7.1.4 SO_LINGER
1502  *
1503  * An application using the TCP-style socket can use this option to
1504  * perform the SCTP ABORT primitive.  The linger option structure is:
1505  *
1506  *  struct  linger {
1507  *     int     l_onoff;                // option on/off
1508  *     int     l_linger;               // linger time
1509  * };
1510  *
1511  * To enable the option, set l_onoff to 1.  If the l_linger value is set
1512  * to 0, calling close() is the same as the ABORT primitive.  If the
1513  * value is set to a negative value, the setsockopt() call will return
1514  * an error.  If the value is set to a positive value linger_time, the
1515  * close() can be blocked for at most linger_time ms.  If the graceful
1516  * shutdown phase does not finish during this period, close() will
1517  * return but the graceful shutdown phase continues in the system.
1518  */
1519 static void sctp_close(struct sock *sk, long timeout)
1520 {
1521         struct net *net = sock_net(sk);
1522         struct sctp_endpoint *ep;
1523         struct sctp_association *asoc;
1524         struct list_head *pos, *temp;
1525         unsigned int data_was_unread;
1526
1527         pr_debug("%s: sk:%p, timeout:%ld\n", __func__, sk, timeout);
1528
1529         lock_sock_nested(sk, SINGLE_DEPTH_NESTING);
1530         sk->sk_shutdown = SHUTDOWN_MASK;
1531         sk->sk_state = SCTP_SS_CLOSING;
1532
1533         ep = sctp_sk(sk)->ep;
1534
1535         /* Clean up any skbs sitting on the receive queue.  */
1536         data_was_unread = sctp_queue_purge_ulpevents(&sk->sk_receive_queue);
1537         data_was_unread += sctp_queue_purge_ulpevents(&sctp_sk(sk)->pd_lobby);
1538
1539         /* Walk all associations on an endpoint.  */
1540         list_for_each_safe(pos, temp, &ep->asocs) {
1541                 asoc = list_entry(pos, struct sctp_association, asocs);
1542
1543                 if (sctp_style(sk, TCP)) {
1544                         /* A closed association can still be in the list if
1545                          * it belongs to a TCP-style listening socket that is
1546                          * not yet accepted. If so, free it. If not, send an
1547                          * ABORT or SHUTDOWN based on the linger options.
1548                          */
1549                         if (sctp_state(asoc, CLOSED)) {
1550                                 sctp_association_free(asoc);
1551                                 continue;
1552                         }
1553                 }
1554
1555                 if (data_was_unread || !skb_queue_empty(&asoc->ulpq.lobby) ||
1556                     !skb_queue_empty(&asoc->ulpq.reasm) ||
1557                     (sock_flag(sk, SOCK_LINGER) && !sk->sk_lingertime)) {
1558                         struct sctp_chunk *chunk;
1559
1560                         chunk = sctp_make_abort_user(asoc, NULL, 0);
1561                         sctp_primitive_ABORT(net, asoc, chunk);
1562                 } else
1563                         sctp_primitive_SHUTDOWN(net, asoc, NULL);
1564         }
1565
1566         /* On a TCP-style socket, block for at most linger_time if set. */
1567         if (sctp_style(sk, TCP) && timeout)
1568                 sctp_wait_for_close(sk, timeout);
1569
1570         /* This will run the backlog queue.  */
1571         release_sock(sk);
1572
1573         /* Supposedly, no process has access to the socket, but
1574          * the net layers still may.
1575          * Also, sctp_destroy_sock() needs to be called with addr_wq_lock
1576          * held and that should be grabbed before socket lock.
1577          */
1578         spin_lock_bh(&net->sctp.addr_wq_lock);
1579         bh_lock_sock_nested(sk);
1580
1581         /* Hold the sock, since sk_common_release() will put sock_put()
1582          * and we have just a little more cleanup.
1583          */
1584         sock_hold(sk);
1585         sk_common_release(sk);
1586
1587         bh_unlock_sock(sk);
1588         spin_unlock_bh(&net->sctp.addr_wq_lock);
1589
1590         sock_put(sk);
1591
1592         SCTP_DBG_OBJCNT_DEC(sock);
1593 }
1594
1595 /* Handle EPIPE error. */
1596 static int sctp_error(struct sock *sk, int flags, int err)
1597 {
1598         if (err == -EPIPE)
1599                 err = sock_error(sk) ? : -EPIPE;
1600         if (err == -EPIPE && !(flags & MSG_NOSIGNAL))
1601                 send_sig(SIGPIPE, current, 0);
1602         return err;
1603 }
1604
1605 /* API 3.1.3 sendmsg() - UDP Style Syntax
1606  *
1607  * An application uses sendmsg() and recvmsg() calls to transmit data to
1608  * and receive data from its peer.
1609  *
1610  *  ssize_t sendmsg(int socket, const struct msghdr *message,
1611  *                  int flags);
1612  *
1613  *  socket  - the socket descriptor of the endpoint.
1614  *  message - pointer to the msghdr structure which contains a single
1615  *            user message and possibly some ancillary data.
1616  *
1617  *            See Section 5 for complete description of the data
1618  *            structures.
1619  *
1620  *  flags   - flags sent or received with the user message, see Section
1621  *            5 for complete description of the flags.
1622  *
1623  * Note:  This function could use a rewrite especially when explicit
1624  * connect support comes in.
1625  */
1626 /* BUG:  We do not implement the equivalent of sk_stream_wait_memory(). */
1627
1628 static int sctp_msghdr_parse(const struct msghdr *msg,
1629                              struct sctp_cmsgs *cmsgs);
1630
1631 static int sctp_sendmsg(struct sock *sk, struct msghdr *msg, size_t msg_len)
1632 {
1633         struct net *net = sock_net(sk);
1634         struct sctp_sock *sp;
1635         struct sctp_endpoint *ep;
1636         struct sctp_association *new_asoc = NULL, *asoc = NULL;
1637         struct sctp_transport *transport, *chunk_tp;
1638         struct sctp_chunk *chunk;
1639         union sctp_addr to;
1640         struct sockaddr *msg_name = NULL;
1641         struct sctp_sndrcvinfo default_sinfo;
1642         struct sctp_sndrcvinfo *sinfo;
1643         struct sctp_initmsg *sinit;
1644         sctp_assoc_t associd = 0;
1645         struct sctp_cmsgs cmsgs = { NULL };
1646         enum sctp_scope scope;
1647         bool fill_sinfo_ttl = false, wait_connect = false;
1648         struct sctp_datamsg *datamsg;
1649         int msg_flags = msg->msg_flags;
1650         __u16 sinfo_flags = 0;
1651         long timeo;
1652         int err;
1653
1654         err = 0;
1655         sp = sctp_sk(sk);
1656         ep = sp->ep;
1657
1658         pr_debug("%s: sk:%p, msg:%p, msg_len:%zu ep:%p\n", __func__, sk,
1659                  msg, msg_len, ep);
1660
1661         /* We cannot send a message over a TCP-style listening socket. */
1662         if (sctp_style(sk, TCP) && sctp_sstate(sk, LISTENING)) {
1663                 err = -EPIPE;
1664                 goto out_nounlock;
1665         }
1666
1667         /* Parse out the SCTP CMSGs.  */
1668         err = sctp_msghdr_parse(msg, &cmsgs);
1669         if (err) {
1670                 pr_debug("%s: msghdr parse err:%x\n", __func__, err);
1671                 goto out_nounlock;
1672         }
1673
1674         /* Fetch the destination address for this packet.  This
1675          * address only selects the association--it is not necessarily
1676          * the address we will send to.
1677          * For a peeled-off socket, msg_name is ignored.
1678          */
1679         if (!sctp_style(sk, UDP_HIGH_BANDWIDTH) && msg->msg_name) {
1680                 int msg_namelen = msg->msg_namelen;
1681
1682                 err = sctp_verify_addr(sk, (union sctp_addr *)msg->msg_name,
1683                                        msg_namelen);
1684                 if (err)
1685                         return err;
1686
1687                 if (msg_namelen > sizeof(to))
1688                         msg_namelen = sizeof(to);
1689                 memcpy(&to, msg->msg_name, msg_namelen);
1690                 msg_name = msg->msg_name;
1691         }
1692
1693         sinit = cmsgs.init;
1694         if (cmsgs.sinfo != NULL) {
1695                 memset(&default_sinfo, 0, sizeof(default_sinfo));
1696                 default_sinfo.sinfo_stream = cmsgs.sinfo->snd_sid;
1697                 default_sinfo.sinfo_flags = cmsgs.sinfo->snd_flags;
1698                 default_sinfo.sinfo_ppid = cmsgs.sinfo->snd_ppid;
1699                 default_sinfo.sinfo_context = cmsgs.sinfo->snd_context;
1700                 default_sinfo.sinfo_assoc_id = cmsgs.sinfo->snd_assoc_id;
1701
1702                 sinfo = &default_sinfo;
1703                 fill_sinfo_ttl = true;
1704         } else {
1705                 sinfo = cmsgs.srinfo;
1706         }
1707         /* Did the user specify SNDINFO/SNDRCVINFO? */
1708         if (sinfo) {
1709                 sinfo_flags = sinfo->sinfo_flags;
1710                 associd = sinfo->sinfo_assoc_id;
1711         }
1712
1713         pr_debug("%s: msg_len:%zu, sinfo_flags:0x%x\n", __func__,
1714                  msg_len, sinfo_flags);
1715
1716         /* SCTP_EOF or SCTP_ABORT cannot be set on a TCP-style socket. */
1717         if (sctp_style(sk, TCP) && (sinfo_flags & (SCTP_EOF | SCTP_ABORT))) {
1718                 err = -EINVAL;
1719                 goto out_nounlock;
1720         }
1721
1722         /* If SCTP_EOF is set, no data can be sent. Disallow sending zero
1723          * length messages when SCTP_EOF|SCTP_ABORT is not set.
1724          * If SCTP_ABORT is set, the message length could be non zero with
1725          * the msg_iov set to the user abort reason.
1726          */
1727         if (((sinfo_flags & SCTP_EOF) && (msg_len > 0)) ||
1728             (!(sinfo_flags & (SCTP_EOF|SCTP_ABORT)) && (msg_len == 0))) {
1729                 err = -EINVAL;
1730                 goto out_nounlock;
1731         }
1732
1733         /* If SCTP_ADDR_OVER is set, there must be an address
1734          * specified in msg_name.
1735          */
1736         if ((sinfo_flags & SCTP_ADDR_OVER) && (!msg->msg_name)) {
1737                 err = -EINVAL;
1738                 goto out_nounlock;
1739         }
1740
1741         transport = NULL;
1742
1743         pr_debug("%s: about to look up association\n", __func__);
1744
1745         lock_sock(sk);
1746
1747         /* If a msg_name has been specified, assume this is to be used.  */
1748         if (msg_name) {
1749                 /* Look for a matching association on the endpoint. */
1750                 asoc = sctp_endpoint_lookup_assoc(ep, &to, &transport);
1751
1752                 /* If we could not find a matching association on the
1753                  * endpoint, make sure that it is not a TCP-style
1754                  * socket that already has an association or there is
1755                  * no peeled-off association on another socket.
1756                  */
1757                 if (!asoc &&
1758                     ((sctp_style(sk, TCP) &&
1759                       (sctp_sstate(sk, ESTABLISHED) ||
1760                        sctp_sstate(sk, CLOSING))) ||
1761                      sctp_endpoint_is_peeled_off(ep, &to))) {
1762                         err = -EADDRNOTAVAIL;
1763                         goto out_unlock;
1764                 }
1765         } else {
1766                 asoc = sctp_id2assoc(sk, associd);
1767                 if (!asoc) {
1768                         err = -EPIPE;
1769                         goto out_unlock;
1770                 }
1771         }
1772
1773         if (asoc) {
1774                 pr_debug("%s: just looked up association:%p\n", __func__, asoc);
1775
1776                 /* We cannot send a message on a TCP-style SCTP_SS_ESTABLISHED
1777                  * socket that has an association in CLOSED state. This can
1778                  * happen when an accepted socket has an association that is
1779                  * already CLOSED.
1780                  */
1781                 if (sctp_state(asoc, CLOSED) && sctp_style(sk, TCP)) {
1782                         err = -EPIPE;
1783                         goto out_unlock;
1784                 }
1785
1786                 if (sinfo_flags & SCTP_EOF) {
1787                         pr_debug("%s: shutting down association:%p\n",
1788                                  __func__, asoc);
1789
1790                         sctp_primitive_SHUTDOWN(net, asoc, NULL);
1791                         err = 0;
1792                         goto out_unlock;
1793                 }
1794                 if (sinfo_flags & SCTP_ABORT) {
1795
1796                         chunk = sctp_make_abort_user(asoc, msg, msg_len);
1797                         if (!chunk) {
1798                                 err = -ENOMEM;
1799                                 goto out_unlock;
1800                         }
1801
1802                         pr_debug("%s: aborting association:%p\n",
1803                                  __func__, asoc);
1804
1805                         sctp_primitive_ABORT(net, asoc, chunk);
1806                         err = 0;
1807                         goto out_unlock;
1808                 }
1809         }
1810
1811         /* Do we need to create the association?  */
1812         if (!asoc) {
1813                 pr_debug("%s: there is no association yet\n", __func__);
1814
1815                 if (sinfo_flags & (SCTP_EOF | SCTP_ABORT)) {
1816                         err = -EINVAL;
1817                         goto out_unlock;
1818                 }
1819
1820                 /* Check for invalid stream against the stream counts,
1821                  * either the default or the user specified stream counts.
1822                  */
1823                 if (sinfo) {
1824                         if (!sinit || !sinit->sinit_num_ostreams) {
1825                                 /* Check against the defaults. */
1826                                 if (sinfo->sinfo_stream >=
1827                                     sp->initmsg.sinit_num_ostreams) {
1828                                         err = -EINVAL;
1829                                         goto out_unlock;
1830                                 }
1831                         } else {
1832                                 /* Check against the requested.  */
1833                                 if (sinfo->sinfo_stream >=
1834                                     sinit->sinit_num_ostreams) {
1835                                         err = -EINVAL;
1836                                         goto out_unlock;
1837                                 }
1838                         }
1839                 }
1840
1841                 /*
1842                  * API 3.1.2 bind() - UDP Style Syntax
1843                  * If a bind() or sctp_bindx() is not called prior to a
1844                  * sendmsg() call that initiates a new association, the
1845                  * system picks an ephemeral port and will choose an address
1846                  * set equivalent to binding with a wildcard address.
1847                  */
1848                 if (!ep->base.bind_addr.port) {
1849                         if (sctp_autobind(sk)) {
1850                                 err = -EAGAIN;
1851                                 goto out_unlock;
1852                         }
1853                 } else {
1854                         /*
1855                          * If an unprivileged user inherits a one-to-many
1856                          * style socket with open associations on a privileged
1857                          * port, it MAY be permitted to accept new associations,
1858                          * but it SHOULD NOT be permitted to open new
1859                          * associations.
1860                          */
1861                         if (ep->base.bind_addr.port < inet_prot_sock(net) &&
1862                             !ns_capable(net->user_ns, CAP_NET_BIND_SERVICE)) {
1863                                 err = -EACCES;
1864                                 goto out_unlock;
1865                         }
1866                 }
1867
1868                 scope = sctp_scope(&to);
1869                 new_asoc = sctp_association_new(ep, sk, scope, GFP_KERNEL);
1870                 if (!new_asoc) {
1871                         err = -ENOMEM;
1872                         goto out_unlock;
1873                 }
1874                 asoc = new_asoc;
1875                 err = sctp_assoc_set_bind_addr_from_ep(asoc, scope, GFP_KERNEL);
1876                 if (err < 0) {
1877                         err = -ENOMEM;
1878                         goto out_free;
1879                 }
1880
1881                 /* If the SCTP_INIT ancillary data is specified, set all
1882                  * the association init values accordingly.
1883                  */
1884                 if (sinit) {
1885                         if (sinit->sinit_num_ostreams) {
1886                                 asoc->c.sinit_num_ostreams =
1887                                         sinit->sinit_num_ostreams;
1888                         }
1889                         if (sinit->sinit_max_instreams) {
1890                                 asoc->c.sinit_max_instreams =
1891                                         sinit->sinit_max_instreams;
1892                         }
1893                         if (sinit->sinit_max_attempts) {
1894                                 asoc->max_init_attempts
1895                                         = sinit->sinit_max_attempts;
1896                         }
1897                         if (sinit->sinit_max_init_timeo) {
1898                                 asoc->max_init_timeo =
1899                                  msecs_to_jiffies(sinit->sinit_max_init_timeo);
1900                         }
1901                 }
1902
1903                 /* Prime the peer's transport structures.  */
1904                 transport = sctp_assoc_add_peer(asoc, &to, GFP_KERNEL, SCTP_UNKNOWN);
1905                 if (!transport) {
1906                         err = -ENOMEM;
1907                         goto out_free;
1908                 }
1909         }
1910
1911         /* ASSERT: we have a valid association at this point.  */
1912         pr_debug("%s: we have a valid association\n", __func__);
1913
1914         if (!sinfo) {
1915                 /* If the user didn't specify SNDINFO/SNDRCVINFO, make up
1916                  * one with some defaults.
1917                  */
1918                 memset(&default_sinfo, 0, sizeof(default_sinfo));
1919                 default_sinfo.sinfo_stream = asoc->default_stream;
1920                 default_sinfo.sinfo_flags = asoc->default_flags;
1921                 default_sinfo.sinfo_ppid = asoc->default_ppid;
1922                 default_sinfo.sinfo_context = asoc->default_context;
1923                 default_sinfo.sinfo_timetolive = asoc->default_timetolive;
1924                 default_sinfo.sinfo_assoc_id = sctp_assoc2id(asoc);
1925
1926                 sinfo = &default_sinfo;
1927         } else if (fill_sinfo_ttl) {
1928                 /* In case SNDINFO was specified, we still need to fill
1929                  * it with a default ttl from the assoc here.
1930                  */
1931                 sinfo->sinfo_timetolive = asoc->default_timetolive;
1932         }
1933
1934         /* API 7.1.7, the sndbuf size per association bounds the
1935          * maximum size of data that can be sent in a single send call.
1936          */
1937         if (msg_len > sk->sk_sndbuf) {
1938                 err = -EMSGSIZE;
1939                 goto out_free;
1940         }
1941
1942         if (asoc->pmtu_pending)
1943                 sctp_assoc_pending_pmtu(asoc);
1944
1945         /* If fragmentation is disabled and the message length exceeds the
1946          * association fragmentation point, return EMSGSIZE.  The I-D
1947          * does not specify what this error is, but this looks like
1948          * a great fit.
1949          */
1950         if (sctp_sk(sk)->disable_fragments && (msg_len > asoc->frag_point)) {
1951                 err = -EMSGSIZE;
1952                 goto out_free;
1953         }
1954
1955         /* Check for invalid stream. */
1956         if (sinfo->sinfo_stream >= asoc->stream.outcnt) {
1957                 err = -EINVAL;
1958                 goto out_free;
1959         }
1960
1961         /* Allocate sctp_stream_out_ext if not already done */
1962         if (unlikely(!asoc->stream.out[sinfo->sinfo_stream].ext)) {
1963                 err = sctp_stream_init_ext(&asoc->stream, sinfo->sinfo_stream);
1964                 if (err)
1965                         goto out_free;
1966         }
1967
1968         if (sctp_wspace(asoc) < msg_len)
1969                 sctp_prsctp_prune(asoc, sinfo, msg_len - sctp_wspace(asoc));
1970
1971         timeo = sock_sndtimeo(sk, msg->msg_flags & MSG_DONTWAIT);
1972         if (!sctp_wspace(asoc)) {
1973                 /* sk can be changed by peel off when waiting for buf. */
1974                 err = sctp_wait_for_sndbuf(asoc, &timeo, msg_len, &sk);
1975                 if (err) {
1976                         if (err == -ESRCH) {
1977                                 /* asoc is already dead. */
1978                                 new_asoc = NULL;
1979                                 err = -EPIPE;
1980                         }
1981                         goto out_free;
1982                 }
1983         }
1984
1985         /* If an address is passed with the sendto/sendmsg call, it is used
1986          * to override the primary destination address in the TCP model, or
1987          * when SCTP_ADDR_OVER flag is set in the UDP model.
1988          */
1989         if ((sctp_style(sk, TCP) && msg_name) ||
1990             (sinfo_flags & SCTP_ADDR_OVER)) {
1991                 chunk_tp = sctp_assoc_lookup_paddr(asoc, &to);
1992                 if (!chunk_tp) {
1993                         err = -EINVAL;
1994                         goto out_free;
1995                 }
1996         } else
1997                 chunk_tp = NULL;
1998
1999         /* Auto-connect, if we aren't connected already. */
2000         if (sctp_state(asoc, CLOSED)) {
2001                 err = sctp_primitive_ASSOCIATE(net, asoc, NULL);
2002                 if (err < 0)
2003                         goto out_free;
2004
2005                 wait_connect = true;
2006                 pr_debug("%s: we associated primitively\n", __func__);
2007         }
2008
2009         /* Break the message into multiple chunks of maximum size. */
2010         datamsg = sctp_datamsg_from_user(asoc, sinfo, &msg->msg_iter);
2011         if (IS_ERR(datamsg)) {
2012                 err = PTR_ERR(datamsg);
2013                 goto out_free;
2014         }
2015         asoc->force_delay = !!(msg->msg_flags & MSG_MORE);
2016
2017         /* Now send the (possibly) fragmented message. */
2018         list_for_each_entry(chunk, &datamsg->chunks, frag_list) {
2019                 sctp_chunk_hold(chunk);
2020
2021                 /* Do accounting for the write space.  */
2022                 sctp_set_owner_w(chunk);
2023
2024                 chunk->transport = chunk_tp;
2025         }
2026
2027         /* Send it to the lower layers.  Note:  all chunks
2028          * must either fail or succeed.   The lower layer
2029          * works that way today.  Keep it that way or this
2030          * breaks.
2031          */
2032         err = sctp_primitive_SEND(net, asoc, datamsg);
2033         /* Did the lower layer accept the chunk? */
2034         if (err) {
2035                 sctp_datamsg_free(datamsg);
2036                 goto out_free;
2037         }
2038
2039         pr_debug("%s: we sent primitively\n", __func__);
2040
2041         sctp_datamsg_put(datamsg);
2042         err = msg_len;
2043
2044         if (unlikely(wait_connect)) {
2045                 timeo = sock_sndtimeo(sk, msg_flags & MSG_DONTWAIT);
2046                 sctp_wait_for_connect(asoc, &timeo);
2047         }
2048
2049         /* If we are already past ASSOCIATE, the lower
2050          * layers are responsible for association cleanup.
2051          */
2052         goto out_unlock;
2053
2054 out_free:
2055         if (new_asoc)
2056                 sctp_association_free(asoc);
2057 out_unlock:
2058         release_sock(sk);
2059
2060 out_nounlock:
2061         return sctp_error(sk, msg_flags, err);
2062
2063 #if 0
2064 do_sock_err:
2065         if (msg_len)
2066                 err = msg_len;
2067         else
2068                 err = sock_error(sk);
2069         goto out;
2070
2071 do_interrupted:
2072         if (msg_len)
2073                 err = msg_len;
2074         goto out;
2075 #endif /* 0 */
2076 }
2077
2078 /* This is an extended version of skb_pull() that removes the data from the
2079  * start of a skb even when data is spread across the list of skb's in the
2080  * frag_list. len specifies the total amount of data that needs to be removed.
2081  * when 'len' bytes could be removed from the skb, it returns 0.
2082  * If 'len' exceeds the total skb length,  it returns the no. of bytes that
2083  * could not be removed.
2084  */
2085 static int sctp_skb_pull(struct sk_buff *skb, int len)
2086 {
2087         struct sk_buff *list;
2088         int skb_len = skb_headlen(skb);
2089         int rlen;
2090
2091         if (len <= skb_len) {
2092                 __skb_pull(skb, len);
2093                 return 0;
2094         }
2095         len -= skb_len;
2096         __skb_pull(skb, skb_len);
2097
2098         skb_walk_frags(skb, list) {
2099                 rlen = sctp_skb_pull(list, len);
2100                 skb->len -= (len-rlen);
2101                 skb->data_len -= (len-rlen);
2102
2103                 if (!rlen)
2104                         return 0;
2105
2106                 len = rlen;
2107         }
2108
2109         return len;
2110 }
2111
2112 /* API 3.1.3  recvmsg() - UDP Style Syntax
2113  *
2114  *  ssize_t recvmsg(int socket, struct msghdr *message,
2115  *                    int flags);
2116  *
2117  *  socket  - the socket descriptor of the endpoint.
2118  *  message - pointer to the msghdr structure which contains a single
2119  *            user message and possibly some ancillary data.
2120  *
2121  *            See Section 5 for complete description of the data
2122  *            structures.
2123  *
2124  *  flags   - flags sent or received with the user message, see Section
2125  *            5 for complete description of the flags.
2126  */
2127 static int sctp_recvmsg(struct sock *sk, struct msghdr *msg, size_t len,
2128                         int noblock, int flags, int *addr_len)
2129 {
2130         struct sctp_ulpevent *event = NULL;
2131         struct sctp_sock *sp = sctp_sk(sk);
2132         struct sk_buff *skb, *head_skb;
2133         int copied;
2134         int err = 0;
2135         int skb_len;
2136
2137         pr_debug("%s: sk:%p, msghdr:%p, len:%zd, noblock:%d, flags:0x%x, "
2138                  "addr_len:%p)\n", __func__, sk, msg, len, noblock, flags,
2139                  addr_len);
2140
2141         lock_sock(sk);
2142
2143         if (sctp_style(sk, TCP) && !sctp_sstate(sk, ESTABLISHED) &&
2144             !sctp_sstate(sk, CLOSING) && !sctp_sstate(sk, CLOSED)) {
2145                 err = -ENOTCONN;
2146                 goto out;
2147         }
2148
2149         skb = sctp_skb_recv_datagram(sk, flags, noblock, &err);
2150         if (!skb)
2151                 goto out;
2152
2153         /* Get the total length of the skb including any skb's in the
2154          * frag_list.
2155          */
2156         skb_len = skb->len;
2157
2158         copied = skb_len;
2159         if (copied > len)
2160                 copied = len;
2161
2162         err = skb_copy_datagram_msg(skb, 0, msg, copied);
2163
2164         event = sctp_skb2event(skb);
2165
2166         if (err)
2167                 goto out_free;
2168
2169         if (event->chunk && event->chunk->head_skb)
2170                 head_skb = event->chunk->head_skb;
2171         else
2172                 head_skb = skb;
2173         sock_recv_ts_and_drops(msg, sk, head_skb);
2174         if (sctp_ulpevent_is_notification(event)) {
2175                 msg->msg_flags |= MSG_NOTIFICATION;
2176                 sp->pf->event_msgname(event, msg->msg_name, addr_len);
2177         } else {
2178                 sp->pf->skb_msgname(head_skb, msg->msg_name, addr_len);
2179         }
2180
2181         /* Check if we allow SCTP_NXTINFO. */
2182         if (sp->recvnxtinfo)
2183                 sctp_ulpevent_read_nxtinfo(event, msg, sk);
2184         /* Check if we allow SCTP_RCVINFO. */
2185         if (sp->recvrcvinfo)
2186                 sctp_ulpevent_read_rcvinfo(event, msg);
2187         /* Check if we allow SCTP_SNDRCVINFO. */
2188         if (sp->subscribe.sctp_data_io_event)
2189                 sctp_ulpevent_read_sndrcvinfo(event, msg);
2190
2191         err = copied;
2192
2193         /* If skb's length exceeds the user's buffer, update the skb and
2194          * push it back to the receive_queue so that the next call to
2195          * recvmsg() will return the remaining data. Don't set MSG_EOR.
2196          */
2197         if (skb_len > copied) {
2198                 msg->msg_flags &= ~MSG_EOR;
2199                 if (flags & MSG_PEEK)
2200                         goto out_free;
2201                 sctp_skb_pull(skb, copied);
2202                 skb_queue_head(&sk->sk_receive_queue, skb);
2203
2204                 /* When only partial message is copied to the user, increase
2205                  * rwnd by that amount. If all the data in the skb is read,
2206                  * rwnd is updated when the event is freed.
2207                  */
2208                 if (!sctp_ulpevent_is_notification(event))
2209                         sctp_assoc_rwnd_increase(event->asoc, copied);
2210                 goto out;
2211         } else if ((event->msg_flags & MSG_NOTIFICATION) ||
2212                    (event->msg_flags & MSG_EOR))
2213                 msg->msg_flags |= MSG_EOR;
2214         else
2215                 msg->msg_flags &= ~MSG_EOR;
2216
2217 out_free:
2218         if (flags & MSG_PEEK) {
2219                 /* Release the skb reference acquired after peeking the skb in
2220                  * sctp_skb_recv_datagram().
2221                  */
2222                 kfree_skb(skb);
2223         } else {
2224                 /* Free the event which includes releasing the reference to
2225                  * the owner of the skb, freeing the skb and updating the
2226                  * rwnd.
2227                  */
2228                 sctp_ulpevent_free(event);
2229         }
2230 out:
2231         release_sock(sk);
2232         return err;
2233 }
2234
2235 /* 7.1.12 Enable/Disable message fragmentation (SCTP_DISABLE_FRAGMENTS)
2236  *
2237  * This option is a on/off flag.  If enabled no SCTP message
2238  * fragmentation will be performed.  Instead if a message being sent
2239  * exceeds the current PMTU size, the message will NOT be sent and
2240  * instead a error will be indicated to the user.
2241  */
2242 static int sctp_setsockopt_disable_fragments(struct sock *sk,
2243                                              char __user *optval,
2244                                              unsigned int optlen)
2245 {
2246         int val;
2247
2248         if (optlen < sizeof(int))
2249                 return -EINVAL;
2250
2251         if (get_user(val, (int __user *)optval))
2252                 return -EFAULT;
2253
2254         sctp_sk(sk)->disable_fragments = (val == 0) ? 0 : 1;
2255
2256         return 0;
2257 }
2258
2259 static int sctp_setsockopt_events(struct sock *sk, char __user *optval,
2260                                   unsigned int optlen)
2261 {
2262         struct sctp_association *asoc;
2263         struct sctp_ulpevent *event;
2264
2265         if (optlen > sizeof(struct sctp_event_subscribe))
2266                 return -EINVAL;
2267         if (copy_from_user(&sctp_sk(sk)->subscribe, optval, optlen))
2268                 return -EFAULT;
2269
2270         /* At the time when a user app subscribes to SCTP_SENDER_DRY_EVENT,
2271          * if there is no data to be sent or retransmit, the stack will
2272          * immediately send up this notification.
2273          */
2274         if (sctp_ulpevent_type_enabled(SCTP_SENDER_DRY_EVENT,
2275                                        &sctp_sk(sk)->subscribe)) {
2276                 asoc = sctp_id2assoc(sk, 0);
2277
2278                 if (asoc && sctp_outq_is_empty(&asoc->outqueue)) {
2279                         event = sctp_ulpevent_make_sender_dry_event(asoc,
2280                                         GFP_ATOMIC);
2281                         if (!event)
2282                                 return -ENOMEM;
2283
2284                         sctp_ulpq_tail_event(&asoc->ulpq, event);
2285                 }
2286         }
2287
2288         return 0;
2289 }
2290
2291 /* 7.1.8 Automatic Close of associations (SCTP_AUTOCLOSE)
2292  *
2293  * This socket option is applicable to the UDP-style socket only.  When
2294  * set it will cause associations that are idle for more than the
2295  * specified number of seconds to automatically close.  An association
2296  * being idle is defined an association that has NOT sent or received
2297  * user data.  The special value of '0' indicates that no automatic
2298  * close of any associations should be performed.  The option expects an
2299  * integer defining the number of seconds of idle time before an
2300  * association is closed.
2301  */
2302 static int sctp_setsockopt_autoclose(struct sock *sk, char __user *optval,
2303                                      unsigned int optlen)
2304 {
2305         struct sctp_sock *sp = sctp_sk(sk);
2306         struct net *net = sock_net(sk);
2307
2308         /* Applicable to UDP-style socket only */
2309         if (sctp_style(sk, TCP))
2310                 return -EOPNOTSUPP;
2311         if (optlen != sizeof(int))
2312                 return -EINVAL;
2313         if (copy_from_user(&sp->autoclose, optval, optlen))
2314                 return -EFAULT;
2315
2316         if (sp->autoclose > net->sctp.max_autoclose)
2317                 sp->autoclose = net->sctp.max_autoclose;
2318
2319         return 0;
2320 }
2321
2322 /* 7.1.13 Peer Address Parameters (SCTP_PEER_ADDR_PARAMS)
2323  *
2324  * Applications can enable or disable heartbeats for any peer address of
2325  * an association, modify an address's heartbeat interval, force a
2326  * heartbeat to be sent immediately, and adjust the address's maximum
2327  * number of retransmissions sent before an address is considered
2328  * unreachable.  The following structure is used to access and modify an
2329  * address's parameters:
2330  *
2331  *  struct sctp_paddrparams {
2332  *     sctp_assoc_t            spp_assoc_id;
2333  *     struct sockaddr_storage spp_address;
2334  *     uint32_t                spp_hbinterval;
2335  *     uint16_t                spp_pathmaxrxt;
2336  *     uint32_t                spp_pathmtu;
2337  *     uint32_t                spp_sackdelay;
2338  *     uint32_t                spp_flags;
2339  * };
2340  *
2341  *   spp_assoc_id    - (one-to-many style socket) This is filled in the
2342  *                     application, and identifies the association for
2343  *                     this query.
2344  *   spp_address     - This specifies which address is of interest.
2345  *   spp_hbinterval  - This contains the value of the heartbeat interval,
2346  *                     in milliseconds.  If a  value of zero
2347  *                     is present in this field then no changes are to
2348  *                     be made to this parameter.
2349  *   spp_pathmaxrxt  - This contains the maximum number of
2350  *                     retransmissions before this address shall be
2351  *                     considered unreachable. If a  value of zero
2352  *                     is present in this field then no changes are to
2353  *                     be made to this parameter.
2354  *   spp_pathmtu     - When Path MTU discovery is disabled the value
2355  *                     specified here will be the "fixed" path mtu.
2356  *                     Note that if the spp_address field is empty
2357  *                     then all associations on this address will
2358  *                     have this fixed path mtu set upon them.
2359  *
2360  *   spp_sackdelay   - When delayed sack is enabled, this value specifies
2361  *                     the number of milliseconds that sacks will be delayed
2362  *                     for. This value will apply to all addresses of an
2363  *                     association if the spp_address field is empty. Note
2364  *                     also, that if delayed sack is enabled and this
2365  *                     value is set to 0, no change is made to the last
2366  *                     recorded delayed sack timer value.
2367  *
2368  *   spp_flags       - These flags are used to control various features
2369  *                     on an association. The flag field may contain
2370  *                     zero or more of the following options.
2371  *
2372  *                     SPP_HB_ENABLE  - Enable heartbeats on the
2373  *                     specified address. Note that if the address
2374  *                     field is empty all addresses for the association
2375  *                     have heartbeats enabled upon them.
2376  *
2377  *                     SPP_HB_DISABLE - Disable heartbeats on the
2378  *                     speicifed address. Note that if the address
2379  *                     field is empty all addresses for the association
2380  *                     will have their heartbeats disabled. Note also
2381  *                     that SPP_HB_ENABLE and SPP_HB_DISABLE are
2382  *                     mutually exclusive, only one of these two should
2383  *                     be specified. Enabling both fields will have
2384  *                     undetermined results.
2385  *
2386  *                     SPP_HB_DEMAND - Request a user initiated heartbeat
2387  *                     to be made immediately.
2388  *
2389  *                     SPP_HB_TIME_IS_ZERO - Specify's that the time for
2390  *                     heartbeat delayis to be set to the value of 0
2391  *                     milliseconds.
2392  *
2393  *                     SPP_PMTUD_ENABLE - This field will enable PMTU
2394  *                     discovery upon the specified address. Note that
2395  *                     if the address feild is empty then all addresses
2396  *                     on the association are effected.
2397  *
2398  *                     SPP_PMTUD_DISABLE - This field will disable PMTU
2399  *                     discovery upon the specified address. Note that
2400  *                     if the address feild is empty then all addresses
2401  *                     on the association are effected. Not also that
2402  *                     SPP_PMTUD_ENABLE and SPP_PMTUD_DISABLE are mutually
2403  *                     exclusive. Enabling both will have undetermined
2404  *                     results.
2405  *
2406  *                     SPP_SACKDELAY_ENABLE - Setting this flag turns
2407  *                     on delayed sack. The time specified in spp_sackdelay
2408  *                     is used to specify the sack delay for this address. Note
2409  *                     that if spp_address is empty then all addresses will
2410  *                     enable delayed sack and take on the sack delay
2411  *                     value specified in spp_sackdelay.
2412  *                     SPP_SACKDELAY_DISABLE - Setting this flag turns
2413  *                     off delayed sack. If the spp_address field is blank then
2414  *                     delayed sack is disabled for the entire association. Note
2415  *                     also that this field is mutually exclusive to
2416  *                     SPP_SACKDELAY_ENABLE, setting both will have undefined
2417  *                     results.
2418  */
2419 static int sctp_apply_peer_addr_params(struct sctp_paddrparams *params,
2420                                        struct sctp_transport   *trans,
2421                                        struct sctp_association *asoc,
2422                                        struct sctp_sock        *sp,
2423                                        int                      hb_change,
2424                                        int                      pmtud_change,
2425                                        int                      sackdelay_change)
2426 {
2427         int error;
2428
2429         if (params->spp_flags & SPP_HB_DEMAND && trans) {
2430                 struct net *net = sock_net(trans->asoc->base.sk);
2431
2432                 error = sctp_primitive_REQUESTHEARTBEAT(net, trans->asoc, trans);
2433                 if (error)
2434                         return error;
2435         }
2436
2437         /* Note that unless the spp_flag is set to SPP_HB_ENABLE the value of
2438          * this field is ignored.  Note also that a value of zero indicates
2439          * the current setting should be left unchanged.
2440          */
2441         if (params->spp_flags & SPP_HB_ENABLE) {
2442
2443                 /* Re-zero the interval if the SPP_HB_TIME_IS_ZERO is
2444                  * set.  This lets us use 0 value when this flag
2445                  * is set.
2446                  */
2447                 if (params->spp_flags & SPP_HB_TIME_IS_ZERO)
2448                         params->spp_hbinterval = 0;
2449
2450                 if (params->spp_hbinterval ||
2451                     (params->spp_flags & SPP_HB_TIME_IS_ZERO)) {
2452                         if (trans) {
2453                                 trans->hbinterval =
2454                                     msecs_to_jiffies(params->spp_hbinterval);
2455                         } else if (asoc) {
2456                                 asoc->hbinterval =
2457                                     msecs_to_jiffies(params->spp_hbinterval);
2458                         } else {
2459                                 sp->hbinterval = params->spp_hbinterval;
2460                         }
2461                 }
2462         }
2463
2464         if (hb_change) {
2465                 if (trans) {
2466                         trans->param_flags =
2467                                 (trans->param_flags & ~SPP_HB) | hb_change;
2468                 } else if (asoc) {
2469                         asoc->param_flags =
2470                                 (asoc->param_flags & ~SPP_HB) | hb_change;
2471                 } else {
2472                         sp->param_flags =
2473                                 (sp->param_flags & ~SPP_HB) | hb_change;
2474                 }
2475         }
2476
2477         /* When Path MTU discovery is disabled the value specified here will
2478          * be the "fixed" path mtu (i.e. the value of the spp_flags field must
2479          * include the flag SPP_PMTUD_DISABLE for this field to have any
2480          * effect).
2481          */
2482         if ((params->spp_flags & SPP_PMTUD_DISABLE) && params->spp_pathmtu) {
2483                 if (trans) {
2484                         trans->pathmtu = params->spp_pathmtu;
2485                         sctp_assoc_sync_pmtu(asoc);
2486                 } else if (asoc) {
2487                         asoc->pathmtu = params->spp_pathmtu;
2488                 } else {
2489                         sp->pathmtu = params->spp_pathmtu;
2490                 }
2491         }
2492
2493         if (pmtud_change) {
2494                 if (trans) {
2495                         int update = (trans->param_flags & SPP_PMTUD_DISABLE) &&
2496                                 (params->spp_flags & SPP_PMTUD_ENABLE);
2497                         trans->param_flags =
2498                                 (trans->param_flags & ~SPP_PMTUD) | pmtud_change;
2499                         if (update) {
2500                                 sctp_transport_pmtu(trans, sctp_opt2sk(sp));
2501                                 sctp_assoc_sync_pmtu(asoc);
2502                         }
2503                 } else if (asoc) {
2504                         asoc->param_flags =
2505                                 (asoc->param_flags & ~SPP_PMTUD) | pmtud_change;
2506                 } else {
2507                         sp->param_flags =
2508                                 (sp->param_flags & ~SPP_PMTUD) | pmtud_change;
2509                 }
2510         }
2511
2512         /* Note that unless the spp_flag is set to SPP_SACKDELAY_ENABLE the
2513          * value of this field is ignored.  Note also that a value of zero
2514          * indicates the current setting should be left unchanged.
2515          */
2516         if ((params->spp_flags & SPP_SACKDELAY_ENABLE) && params->spp_sackdelay) {
2517                 if (trans) {
2518                         trans->sackdelay =
2519                                 msecs_to_jiffies(params->spp_sackdelay);
2520                 } else if (asoc) {
2521                         asoc->sackdelay =
2522                                 msecs_to_jiffies(params->spp_sackdelay);
2523                 } else {
2524                         sp->sackdelay = params->spp_sackdelay;
2525                 }
2526         }
2527
2528         if (sackdelay_change) {
2529                 if (trans) {
2530                         trans->param_flags =
2531                                 (trans->param_flags & ~SPP_SACKDELAY) |
2532                                 sackdelay_change;
2533                 } else if (asoc) {
2534                         asoc->param_flags =
2535                                 (asoc->param_flags & ~SPP_SACKDELAY) |
2536                                 sackdelay_change;
2537                 } else {
2538                         sp->param_flags =
2539                                 (sp->param_flags & ~SPP_SACKDELAY) |
2540                                 sackdelay_change;
2541                 }
2542         }
2543
2544         /* Note that a value of zero indicates the current setting should be
2545            left unchanged.
2546          */
2547         if (params->spp_pathmaxrxt) {
2548                 if (trans) {
2549                         trans->pathmaxrxt = params->spp_pathmaxrxt;
2550                 } else if (asoc) {
2551                         asoc->pathmaxrxt = params->spp_pathmaxrxt;
2552                 } else {
2553                         sp->pathmaxrxt = params->spp_pathmaxrxt;
2554                 }
2555         }
2556
2557         return 0;
2558 }
2559
2560 static int sctp_setsockopt_peer_addr_params(struct sock *sk,
2561                                             char __user *optval,
2562                                             unsigned int optlen)
2563 {
2564         struct sctp_paddrparams  params;
2565         struct sctp_transport   *trans = NULL;
2566         struct sctp_association *asoc = NULL;
2567         struct sctp_sock        *sp = sctp_sk(sk);
2568         int error;
2569         int hb_change, pmtud_change, sackdelay_change;
2570
2571         if (optlen != sizeof(struct sctp_paddrparams))
2572                 return -EINVAL;
2573
2574         if (copy_from_user(&params, optval, optlen))
2575                 return -EFAULT;
2576
2577         /* Validate flags and value parameters. */
2578         hb_change        = params.spp_flags & SPP_HB;
2579         pmtud_change     = params.spp_flags & SPP_PMTUD;
2580         sackdelay_change = params.spp_flags & SPP_SACKDELAY;
2581
2582         if (hb_change        == SPP_HB ||
2583             pmtud_change     == SPP_PMTUD ||
2584             sackdelay_change == SPP_SACKDELAY ||
2585             params.spp_sackdelay > 500 ||
2586             (params.spp_pathmtu &&
2587              params.spp_pathmtu < SCTP_DEFAULT_MINSEGMENT))
2588                 return -EINVAL;
2589
2590         /* If an address other than INADDR_ANY is specified, and
2591          * no transport is found, then the request is invalid.
2592          */
2593         if (!sctp_is_any(sk, (union sctp_addr *)&params.spp_address)) {
2594                 trans = sctp_addr_id2transport(sk, &params.spp_address,
2595                                                params.spp_assoc_id);
2596                 if (!trans)
2597                         return -EINVAL;
2598         }
2599
2600         /* Get association, if assoc_id != 0 and the socket is a one
2601          * to many style socket, and an association was not found, then
2602          * the id was invalid.
2603          */
2604         asoc = sctp_id2assoc(sk, params.spp_assoc_id);
2605         if (!asoc && params.spp_assoc_id && sctp_style(sk, UDP))
2606                 return -EINVAL;
2607
2608         /* Heartbeat demand can only be sent on a transport or
2609          * association, but not a socket.
2610          */
2611         if (params.spp_flags & SPP_HB_DEMAND && !trans && !asoc)
2612                 return -EINVAL;
2613
2614         /* Process parameters. */
2615         error = sctp_apply_peer_addr_params(&params, trans, asoc, sp,
2616                                             hb_change, pmtud_change,
2617                                             sackdelay_change);
2618
2619         if (error)
2620                 return error;
2621
2622         /* If changes are for association, also apply parameters to each
2623          * transport.
2624          */
2625         if (!trans && asoc) {
2626                 list_for_each_entry(trans, &asoc->peer.transport_addr_list,
2627                                 transports) {
2628                         sctp_apply_peer_addr_params(&params, trans, asoc, sp,
2629                                                     hb_change, pmtud_change,
2630                                                     sackdelay_change);
2631                 }
2632         }
2633
2634         return 0;
2635 }
2636
2637 static inline __u32 sctp_spp_sackdelay_enable(__u32 param_flags)
2638 {
2639         return (param_flags & ~SPP_SACKDELAY) | SPP_SACKDELAY_ENABLE;
2640 }
2641
2642 static inline __u32 sctp_spp_sackdelay_disable(__u32 param_flags)
2643 {
2644         return (param_flags & ~SPP_SACKDELAY) | SPP_SACKDELAY_DISABLE;
2645 }
2646
2647 /*
2648  * 7.1.23.  Get or set delayed ack timer (SCTP_DELAYED_SACK)
2649  *
2650  * This option will effect the way delayed acks are performed.  This
2651  * option allows you to get or set the delayed ack time, in
2652  * milliseconds.  It also allows changing the delayed ack frequency.
2653  * Changing the frequency to 1 disables the delayed sack algorithm.  If
2654  * the assoc_id is 0, then this sets or gets the endpoints default
2655  * values.  If the assoc_id field is non-zero, then the set or get
2656  * effects the specified association for the one to many model (the
2657  * assoc_id field is ignored by the one to one model).  Note that if
2658  * sack_delay or sack_freq are 0 when setting this option, then the
2659  * current values will remain unchanged.
2660  *
2661  * struct sctp_sack_info {
2662  *     sctp_assoc_t            sack_assoc_id;
2663  *     uint32_t                sack_delay;
2664  *     uint32_t                sack_freq;
2665  * };
2666  *
2667  * sack_assoc_id -  This parameter, indicates which association the user
2668  *    is performing an action upon.  Note that if this field's value is
2669  *    zero then the endpoints default value is changed (effecting future
2670  *    associations only).
2671  *
2672  * sack_delay -  This parameter contains the number of milliseconds that
2673  *    the user is requesting the delayed ACK timer be set to.  Note that
2674  *    this value is defined in the standard to be between 200 and 500
2675  *    milliseconds.
2676  *
2677  * sack_freq -  This parameter contains the number of packets that must
2678  *    be received before a sack is sent without waiting for the delay
2679  *    timer to expire.  The default value for this is 2, setting this
2680  *    value to 1 will disable the delayed sack algorithm.
2681  */
2682
2683 static int sctp_setsockopt_delayed_ack(struct sock *sk,
2684                                        char __user *optval, unsigned int optlen)
2685 {
2686         struct sctp_sack_info    params;
2687         struct sctp_transport   *trans = NULL;
2688         struct sctp_association *asoc = NULL;
2689         struct sctp_sock        *sp = sctp_sk(sk);
2690
2691         if (optlen == sizeof(struct sctp_sack_info)) {
2692                 if (copy_from_user(&params, optval, optlen))
2693                         return -EFAULT;
2694
2695                 if (params.sack_delay == 0 && params.sack_freq == 0)
2696                         return 0;
2697         } else if (optlen == sizeof(struct sctp_assoc_value)) {
2698                 pr_warn_ratelimited(DEPRECATED
2699                                     "%s (pid %d) "
2700                                     "Use of struct sctp_assoc_value in delayed_ack socket option.\n"
2701                                     "Use struct sctp_sack_info instead\n",
2702                                     current->comm, task_pid_nr(current));
2703                 if (copy_from_user(&params, optval, optlen))
2704                         return -EFAULT;
2705
2706                 if (params.sack_delay == 0)
2707                         params.sack_freq = 1;
2708                 else
2709                         params.sack_freq = 0;
2710         } else
2711                 return -EINVAL;
2712
2713         /* Validate value parameter. */
2714         if (params.sack_delay > 500)
2715                 return -EINVAL;
2716
2717         /* Get association, if sack_assoc_id != 0 and the socket is a one
2718          * to many style socket, and an association was not found, then
2719          * the id was invalid.
2720          */
2721         asoc = sctp_id2assoc(sk, params.sack_assoc_id);
2722         if (!asoc && params.sack_assoc_id && sctp_style(sk, UDP))
2723                 return -EINVAL;
2724
2725         if (params.sack_delay) {
2726                 if (asoc) {
2727                         asoc->sackdelay =
2728                                 msecs_to_jiffies(params.sack_delay);
2729                         asoc->param_flags =
2730                                 sctp_spp_sackdelay_enable(asoc->param_flags);
2731                 } else {
2732                         sp->sackdelay = params.sack_delay;
2733                         sp->param_flags =
2734                                 sctp_spp_sackdelay_enable(sp->param_flags);
2735                 }
2736         }
2737
2738         if (params.sack_freq == 1) {
2739                 if (asoc) {
2740                         asoc->param_flags =
2741                                 sctp_spp_sackdelay_disable(asoc->param_flags);
2742                 } else {
2743                         sp->param_flags =
2744                                 sctp_spp_sackdelay_disable(sp->param_flags);
2745                 }
2746         } else if (params.sack_freq > 1) {
2747                 if (asoc) {
2748                         asoc->sackfreq = params.sack_freq;
2749                         asoc->param_flags =
2750                                 sctp_spp_sackdelay_enable(asoc->param_flags);
2751                 } else {
2752                         sp->sackfreq = params.sack_freq;
2753                         sp->param_flags =
2754                                 sctp_spp_sackdelay_enable(sp->param_flags);
2755                 }
2756         }
2757
2758         /* If change is for association, also apply to each transport. */
2759         if (asoc) {
2760                 list_for_each_entry(trans, &asoc->peer.transport_addr_list,
2761                                 transports) {
2762                         if (params.sack_delay) {
2763                                 trans->sackdelay =
2764                                         msecs_to_jiffies(params.sack_delay);
2765                                 trans->param_flags =
2766                                         sctp_spp_sackdelay_enable(trans->param_flags);
2767                         }
2768                         if (params.sack_freq == 1) {
2769                                 trans->param_flags =
2770                                         sctp_spp_sackdelay_disable(trans->param_flags);
2771                         } else if (params.sack_freq > 1) {
2772                                 trans->sackfreq = params.sack_freq;
2773                                 trans->param_flags =
2774                                         sctp_spp_sackdelay_enable(trans->param_flags);
2775                         }
2776                 }
2777         }
2778
2779         return 0;
2780 }
2781
2782 /* 7.1.3 Initialization Parameters (SCTP_INITMSG)
2783  *
2784  * Applications can specify protocol parameters for the default association
2785  * initialization.  The option name argument to setsockopt() and getsockopt()
2786  * is SCTP_INITMSG.
2787  *
2788  * Setting initialization parameters is effective only on an unconnected
2789  * socket (for UDP-style sockets only future associations are effected
2790  * by the change).  With TCP-style sockets, this option is inherited by
2791  * sockets derived from a listener socket.
2792  */
2793 static int sctp_setsockopt_initmsg(struct sock *sk, char __user *optval, unsigned int optlen)
2794 {
2795         struct sctp_initmsg sinit;
2796         struct sctp_sock *sp = sctp_sk(sk);
2797
2798         if (optlen != sizeof(struct sctp_initmsg))
2799                 return -EINVAL;
2800         if (copy_from_user(&sinit, optval, optlen))
2801                 return -EFAULT;
2802
2803         if (sinit.sinit_num_ostreams)
2804                 sp->initmsg.sinit_num_ostreams = sinit.sinit_num_ostreams;
2805         if (sinit.sinit_max_instreams)
2806                 sp->initmsg.sinit_max_instreams = sinit.sinit_max_instreams;
2807         if (sinit.sinit_max_attempts)
2808                 sp->initmsg.sinit_max_attempts = sinit.sinit_max_attempts;
2809         if (sinit.sinit_max_init_timeo)
2810                 sp->initmsg.sinit_max_init_timeo = sinit.sinit_max_init_timeo;
2811
2812         return 0;
2813 }
2814
2815 /*
2816  * 7.1.14 Set default send parameters (SCTP_DEFAULT_SEND_PARAM)
2817  *
2818  *   Applications that wish to use the sendto() system call may wish to
2819  *   specify a default set of parameters that would normally be supplied
2820  *   through the inclusion of ancillary data.  This socket option allows
2821  *   such an application to set the default sctp_sndrcvinfo structure.
2822  *   The application that wishes to use this socket option simply passes
2823  *   in to this call the sctp_sndrcvinfo structure defined in Section
2824  *   5.2.2) The input parameters accepted by this call include
2825  *   sinfo_stream, sinfo_flags, sinfo_ppid, sinfo_context,
2826  *   sinfo_timetolive.  The user must provide the sinfo_assoc_id field in
2827  *   to this call if the caller is using the UDP model.
2828  */
2829 static int sctp_setsockopt_default_send_param(struct sock *sk,
2830                                               char __user *optval,
2831                                               unsigned int optlen)
2832 {
2833         struct sctp_sock *sp = sctp_sk(sk);
2834         struct sctp_association *asoc;
2835         struct sctp_sndrcvinfo info;
2836
2837         if (optlen != sizeof(info))
2838                 return -EINVAL;
2839         if (copy_from_user(&info, optval, optlen))
2840                 return -EFAULT;
2841         if (info.sinfo_flags &
2842             ~(SCTP_UNORDERED | SCTP_ADDR_OVER |
2843               SCTP_ABORT | SCTP_EOF))
2844                 return -EINVAL;
2845
2846         asoc = sctp_id2assoc(sk, info.sinfo_assoc_id);
2847         if (!asoc && info.sinfo_assoc_id && sctp_style(sk, UDP))
2848                 return -EINVAL;
2849         if (asoc) {
2850                 asoc->default_stream = info.sinfo_stream;
2851                 asoc->default_flags = info.sinfo_flags;
2852                 asoc->default_ppid = info.sinfo_ppid;
2853                 asoc->default_context = info.sinfo_context;
2854                 asoc->default_timetolive = info.sinfo_timetolive;
2855         } else {
2856                 sp->default_stream = info.sinfo_stream;
2857                 sp->default_flags = info.sinfo_flags;
2858                 sp->default_ppid = info.sinfo_ppid;
2859                 sp->default_context = info.sinfo_context;
2860                 sp->default_timetolive = info.sinfo_timetolive;
2861         }
2862
2863         return 0;
2864 }
2865
2866 /* RFC6458, Section 8.1.31. Set/get Default Send Parameters
2867  * (SCTP_DEFAULT_SNDINFO)
2868  */
2869 static int sctp_setsockopt_default_sndinfo(struct sock *sk,
2870                                            char __user *optval,
2871                                            unsigned int optlen)
2872 {
2873         struct sctp_sock *sp = sctp_sk(sk);
2874         struct sctp_association *asoc;
2875         struct sctp_sndinfo info;
2876
2877         if (optlen != sizeof(info))
2878                 return -EINVAL;
2879         if (copy_from_user(&info, optval, optlen))
2880                 return -EFAULT;
2881         if (info.snd_flags &
2882             ~(SCTP_UNORDERED | SCTP_ADDR_OVER |
2883               SCTP_ABORT | SCTP_EOF))
2884                 return -EINVAL;
2885
2886         asoc = sctp_id2assoc(sk, info.snd_assoc_id);
2887         if (!asoc && info.snd_assoc_id && sctp_style(sk, UDP))
2888                 return -EINVAL;
2889         if (asoc) {
2890                 asoc->default_stream = info.snd_sid;
2891                 asoc->default_flags = info.snd_flags;
2892                 asoc->default_ppid = info.snd_ppid;
2893                 asoc->default_context = info.snd_context;
2894         } else {
2895                 sp->default_stream = info.snd_sid;
2896                 sp->default_flags = info.snd_flags;
2897                 sp->default_ppid = info.snd_ppid;
2898                 sp->default_context = info.snd_context;
2899         }
2900
2901         return 0;
2902 }
2903
2904 /* 7.1.10 Set Primary Address (SCTP_PRIMARY_ADDR)
2905  *
2906  * Requests that the local SCTP stack use the enclosed peer address as
2907  * the association primary.  The enclosed address must be one of the
2908  * association peer's addresses.
2909  */
2910 static int sctp_setsockopt_primary_addr(struct sock *sk, char __user *optval,
2911                                         unsigned int optlen)
2912 {
2913         struct sctp_prim prim;
2914         struct sctp_transport *trans;
2915
2916         if (optlen != sizeof(struct sctp_prim))
2917                 return -EINVAL;
2918
2919         if (copy_from_user(&prim, optval, sizeof(struct sctp_prim)))
2920                 return -EFAULT;
2921
2922         trans = sctp_addr_id2transport(sk, &prim.ssp_addr, prim.ssp_assoc_id);
2923         if (!trans)
2924                 return -EINVAL;
2925
2926         sctp_assoc_set_primary(trans->asoc, trans);
2927
2928         return 0;
2929 }
2930
2931 /*
2932  * 7.1.5 SCTP_NODELAY
2933  *
2934  * Turn on/off any Nagle-like algorithm.  This means that packets are
2935  * generally sent as soon as possible and no unnecessary delays are
2936  * introduced, at the cost of more packets in the network.  Expects an
2937  *  integer boolean flag.
2938  */
2939 static int sctp_setsockopt_nodelay(struct sock *sk, char __user *optval,
2940                                    unsigned int optlen)
2941 {
2942         int val;
2943
2944         if (optlen < sizeof(int))
2945                 return -EINVAL;
2946         if (get_user(val, (int __user *)optval))
2947                 return -EFAULT;
2948
2949         sctp_sk(sk)->nodelay = (val == 0) ? 0 : 1;
2950         return 0;
2951 }
2952
2953 /*
2954  *
2955  * 7.1.1 SCTP_RTOINFO
2956  *
2957  * The protocol parameters used to initialize and bound retransmission
2958  * timeout (RTO) are tunable. sctp_rtoinfo structure is used to access
2959  * and modify these parameters.
2960  * All parameters are time values, in milliseconds.  A value of 0, when
2961  * modifying the parameters, indicates that the current value should not
2962  * be changed.
2963  *
2964  */
2965 static int sctp_setsockopt_rtoinfo(struct sock *sk, char __user *optval, unsigned int optlen)
2966 {
2967         struct sctp_rtoinfo rtoinfo;
2968         struct sctp_association *asoc;
2969         unsigned long rto_min, rto_max;
2970         struct sctp_sock *sp = sctp_sk(sk);
2971
2972         if (optlen != sizeof (struct sctp_rtoinfo))
2973                 return -EINVAL;
2974
2975         if (copy_from_user(&rtoinfo, optval, optlen))
2976                 return -EFAULT;
2977
2978         asoc = sctp_id2assoc(sk, rtoinfo.srto_assoc_id);
2979
2980         /* Set the values to the specific association */
2981         if (!asoc && rtoinfo.srto_assoc_id && sctp_style(sk, UDP))
2982                 return -EINVAL;
2983
2984         rto_max = rtoinfo.srto_max;
2985         rto_min = rtoinfo.srto_min;
2986
2987         if (rto_max)
2988                 rto_max = asoc ? msecs_to_jiffies(rto_max) : rto_max;
2989         else
2990                 rto_max = asoc ? asoc->rto_max : sp->rtoinfo.srto_max;
2991
2992         if (rto_min)
2993                 rto_min = asoc ? msecs_to_jiffies(rto_min) : rto_min;
2994         else
2995                 rto_min = asoc ? asoc->rto_min : sp->rtoinfo.srto_min;
2996
2997         if (rto_min > rto_max)
2998                 return -EINVAL;
2999
3000         if (asoc) {
3001                 if (rtoinfo.srto_initial != 0)
3002                         asoc->rto_initial =
3003                                 msecs_to_jiffies(rtoinfo.srto_initial);
3004                 asoc->rto_max = rto_max;
3005                 asoc->rto_min = rto_min;
3006         } else {
3007                 /* If there is no association or the association-id = 0
3008                  * set the values to the endpoint.
3009                  */
3010                 if (rtoinfo.srto_initial != 0)
3011                         sp->rtoinfo.srto_initial = rtoinfo.srto_initial;
3012                 sp->rtoinfo.srto_max = rto_max;
3013                 sp->rtoinfo.srto_min = rto_min;
3014         }
3015
3016         return 0;
3017 }
3018
3019 /*
3020  *
3021  * 7.1.2 SCTP_ASSOCINFO
3022  *
3023  * This option is used to tune the maximum retransmission attempts
3024  * of the association.
3025  * Returns an error if the new association retransmission value is
3026  * greater than the sum of the retransmission value  of the peer.
3027  * See [SCTP] for more information.
3028  *
3029  */
3030 static int sctp_setsockopt_associnfo(struct sock *sk, char __user *optval, unsigned int optlen)
3031 {
3032
3033         struct sctp_assocparams assocparams;
3034         struct sctp_association *asoc;
3035
3036         if (optlen != sizeof(struct sctp_assocparams))
3037                 return -EINVAL;
3038         if (copy_from_user(&assocparams, optval, optlen))
3039                 return -EFAULT;
3040
3041         asoc = sctp_id2assoc(sk, assocparams.sasoc_assoc_id);
3042
3043         if (!asoc && assocparams.sasoc_assoc_id && sctp_style(sk, UDP))
3044                 return -EINVAL;
3045
3046         /* Set the values to the specific association */
3047         if (asoc) {
3048                 if (assocparams.sasoc_asocmaxrxt != 0) {
3049                         __u32 path_sum = 0;
3050                         int   paths = 0;
3051                         struct sctp_transport *peer_addr;
3052
3053                         list_for_each_entry(peer_addr, &asoc->peer.transport_addr_list,
3054                                         transports) {
3055                                 path_sum += peer_addr->pathmaxrxt;
3056                                 paths++;
3057                         }
3058
3059                         /* Only validate asocmaxrxt if we have more than
3060                          * one path/transport.  We do this because path
3061                          * retransmissions are only counted when we have more
3062                          * then one path.
3063                          */
3064                         if (paths > 1 &&
3065                             assocparams.sasoc_asocmaxrxt > path_sum)
3066                                 return -EINVAL;
3067
3068                         asoc->max_retrans = assocparams.sasoc_asocmaxrxt;
3069                 }
3070
3071                 if (assocparams.sasoc_cookie_life != 0)
3072                         asoc->cookie_life = ms_to_ktime(assocparams.sasoc_cookie_life);
3073         } else {
3074                 /* Set the values to the endpoint */
3075                 struct sctp_sock *sp = sctp_sk(sk);
3076
3077                 if (assocparams.sasoc_asocmaxrxt != 0)
3078                         sp->assocparams.sasoc_asocmaxrxt =
3079                                                 assocparams.sasoc_asocmaxrxt;
3080                 if (assocparams.sasoc_cookie_life != 0)
3081                         sp->assocparams.sasoc_cookie_life =
3082                                                 assocparams.sasoc_cookie_life;
3083         }
3084         return 0;
3085 }
3086
3087 /*
3088  * 7.1.16 Set/clear IPv4 mapped addresses (SCTP_I_WANT_MAPPED_V4_ADDR)
3089  *
3090  * This socket option is a boolean flag which turns on or off mapped V4
3091  * addresses.  If this option is turned on and the socket is type
3092  * PF_INET6, then IPv4 addresses will be mapped to V6 representation.
3093  * If this option is turned off, then no mapping will be done of V4
3094  * addresses and a user will receive both PF_INET6 and PF_INET type
3095  * addresses on the socket.
3096  */
3097 static int sctp_setsockopt_mappedv4(struct sock *sk, char __user *optval, unsigned int optlen)
3098 {
3099         int val;
3100         struct sctp_sock *sp = sctp_sk(sk);
3101
3102         if (optlen < sizeof(int))
3103                 return -EINVAL;
3104         if (get_user(val, (int __user *)optval))
3105                 return -EFAULT;
3106         if (val)
3107                 sp->v4mapped = 1;
3108         else
3109                 sp->v4mapped = 0;
3110
3111         return 0;
3112 }
3113
3114 /*
3115  * 8.1.16.  Get or Set the Maximum Fragmentation Size (SCTP_MAXSEG)
3116  * This option will get or set the maximum size to put in any outgoing
3117  * SCTP DATA chunk.  If a message is larger than this size it will be
3118  * fragmented by SCTP into the specified size.  Note that the underlying
3119  * SCTP implementation may fragment into smaller sized chunks when the
3120  * PMTU of the underlying association is smaller than the value set by
3121  * the user.  The default value for this option is '0' which indicates
3122  * the user is NOT limiting fragmentation and only the PMTU will effect
3123  * SCTP's choice of DATA chunk size.  Note also that values set larger
3124  * than the maximum size of an IP datagram will effectively let SCTP
3125  * control fragmentation (i.e. the same as setting this option to 0).
3126  *
3127  * The following structure is used to access and modify this parameter:
3128  *
3129  * struct sctp_assoc_value {
3130  *   sctp_assoc_t assoc_id;
3131  *   uint32_t assoc_value;
3132  * };
3133  *
3134  * assoc_id:  This parameter is ignored for one-to-one style sockets.
3135  *    For one-to-many style sockets this parameter indicates which
3136  *    association the user is performing an action upon.  Note that if
3137  *    this field's value is zero then the endpoints default value is
3138  *    changed (effecting future associations only).
3139  * assoc_value:  This parameter specifies the maximum size in bytes.
3140  */
3141 static int sctp_setsockopt_maxseg(struct sock *sk, char __user *optval, unsigned int optlen)
3142 {
3143         struct sctp_sock *sp = sctp_sk(sk);
3144         struct sctp_assoc_value params;
3145         struct sctp_association *asoc;
3146         int val;
3147
3148         if (optlen == sizeof(int)) {
3149                 pr_warn_ratelimited(DEPRECATED
3150                                     "%s (pid %d) "
3151                                     "Use of int in maxseg socket option.\n"
3152                                     "Use struct sctp_assoc_value instead\n",
3153                                     current->comm, task_pid_nr(current));
3154                 if (copy_from_user(&val, optval, optlen))
3155                         return -EFAULT;
3156                 params.assoc_id = 0;
3157         } else if (optlen == sizeof(struct sctp_assoc_value)) {
3158                 if (copy_from_user(&params, optval, optlen))
3159                         return -EFAULT;
3160                 val = params.assoc_value;
3161         } else {
3162                 return -EINVAL;
3163         }
3164
3165         if (val) {
3166                 int min_len, max_len;
3167
3168                 min_len = SCTP_DEFAULT_MINSEGMENT - sp->pf->af->net_header_len;
3169                 min_len -= sizeof(struct sctphdr) +
3170                            sizeof(struct sctp_data_chunk);
3171
3172                 max_len = SCTP_MAX_CHUNK_LEN - sizeof(struct sctp_data_chunk);
3173
3174                 if (val < min_len || val > max_len)
3175                         return -EINVAL;
3176         }
3177
3178         asoc = sctp_id2assoc(sk, params.assoc_id);
3179         if (asoc) {
3180                 if (val == 0) {
3181                         val = asoc->pathmtu - sp->pf->af->net_header_len;
3182                         val -= sizeof(struct sctphdr) +
3183                                sizeof(struct sctp_data_chunk);
3184                 }
3185                 asoc->user_frag = val;
3186                 asoc->frag_point = sctp_frag_point(asoc, asoc->pathmtu);
3187         } else {
3188                 if (params.assoc_id && sctp_style(sk, UDP))
3189                         return -EINVAL;
3190                 sp->user_frag = val;
3191         }
3192
3193         return 0;
3194 }
3195
3196
3197 /*
3198  *  7.1.9 Set Peer Primary Address (SCTP_SET_PEER_PRIMARY_ADDR)
3199  *
3200  *   Requests that the peer mark the enclosed address as the association
3201  *   primary. The enclosed address must be one of the association's
3202  *   locally bound addresses. The following structure is used to make a
3203  *   set primary request:
3204  */
3205 static int sctp_setsockopt_peer_primary_addr(struct sock *sk, char __user *optval,
3206                                              unsigned int optlen)
3207 {
3208         struct net *net = sock_net(sk);
3209         struct sctp_sock        *sp;
3210         struct sctp_association *asoc = NULL;
3211         struct sctp_setpeerprim prim;
3212         struct sctp_chunk       *chunk;
3213         struct sctp_af          *af;
3214         int                     err;
3215
3216         sp = sctp_sk(sk);
3217
3218         if (!net->sctp.addip_enable)
3219                 return -EPERM;
3220
3221         if (optlen != sizeof(struct sctp_setpeerprim))
3222                 return -EINVAL;
3223
3224         if (copy_from_user(&prim, optval, optlen))
3225                 return -EFAULT;
3226
3227         asoc = sctp_id2assoc(sk, prim.sspp_assoc_id);
3228         if (!asoc)
3229                 return -EINVAL;
3230
3231         if (!asoc->peer.asconf_capable)
3232                 return -EPERM;
3233
3234         if (asoc->peer.addip_disabled_mask & SCTP_PARAM_SET_PRIMARY)
3235                 return -EPERM;
3236
3237         if (!sctp_state(asoc, ESTABLISHED))
3238                 return -ENOTCONN;
3239
3240         af = sctp_get_af_specific(prim.sspp_addr.ss_family);
3241         if (!af)
3242                 return -EINVAL;
3243
3244         if (!af->addr_valid((union sctp_addr *)&prim.sspp_addr, sp, NULL))
3245                 return -EADDRNOTAVAIL;
3246
3247         if (!sctp_assoc_lookup_laddr(asoc, (union sctp_addr *)&prim.sspp_addr))
3248                 return -EADDRNOTAVAIL;
3249
3250         /* Create an ASCONF chunk with SET_PRIMARY parameter    */
3251         chunk = sctp_make_asconf_set_prim(asoc,
3252                                           (union sctp_addr *)&prim.sspp_addr);
3253         if (!chunk)
3254                 return -ENOMEM;
3255
3256         err = sctp_send_asconf(asoc, chunk);
3257
3258         pr_debug("%s: we set peer primary addr primitively\n", __func__);
3259
3260         return err;
3261 }
3262
3263 static int sctp_setsockopt_adaptation_layer(struct sock *sk, char __user *optval,
3264                                             unsigned int optlen)
3265 {
3266         struct sctp_setadaptation adaptation;
3267
3268         if (optlen != sizeof(struct sctp_setadaptation))
3269                 return -EINVAL;
3270         if (copy_from_user(&adaptation, optval, optlen))
3271                 return -EFAULT;
3272
3273         sctp_sk(sk)->adaptation_ind = adaptation.ssb_adaptation_ind;
3274
3275         return 0;
3276 }
3277
3278 /*
3279  * 7.1.29.  Set or Get the default context (SCTP_CONTEXT)
3280  *
3281  * The context field in the sctp_sndrcvinfo structure is normally only
3282  * used when a failed message is retrieved holding the value that was
3283  * sent down on the actual send call.  This option allows the setting of
3284  * a default context on an association basis that will be received on
3285  * reading messages from the peer.  This is especially helpful in the
3286  * one-2-many model for an application to keep some reference to an
3287  * internal state machine that is processing messages on the
3288  * association.  Note that the setting of this value only effects
3289  * received messages from the peer and does not effect the value that is
3290  * saved with outbound messages.
3291  */
3292 static int sctp_setsockopt_context(struct sock *sk, char __user *optval,
3293                                    unsigned int optlen)
3294 {
3295         struct sctp_assoc_value params;
3296         struct sctp_sock *sp;
3297         struct sctp_association *asoc;
3298
3299         if (optlen != sizeof(struct sctp_assoc_value))
3300                 return -EINVAL;
3301         if (copy_from_user(&params, optval, optlen))
3302                 return -EFAULT;
3303
3304         sp = sctp_sk(sk);
3305
3306         if (params.assoc_id != 0) {
3307                 asoc = sctp_id2assoc(sk, params.assoc_id);
3308                 if (!asoc)
3309                         return -EINVAL;
3310                 asoc->default_rcv_context = params.assoc_value;
3311         } else {
3312                 sp->default_rcv_context = params.assoc_value;
3313         }
3314
3315         return 0;
3316 }
3317
3318 /*
3319  * 7.1.24.  Get or set fragmented interleave (SCTP_FRAGMENT_INTERLEAVE)
3320  *